Document made available under the 
Patent Cooperation Treaty (PCT) 



International application number: PCT/EP05/001688 
International filing date: 18 February 2005 (18.02.2005) 



Document type: Certified copy of priority document 

Document details: Country/Office: DE 

Number: 10 2004 013 843.5 

Filing date: 20 March 2004 (20.03.2004) 



Date of receipt at the International Bureau: 05 August 2005 (05.08.2005) 

Remark: Priority document submitted or transmitted to the International Bureau in 

compliance with Rule 17.1(a) or (b) 




World Intellectual Property Organization (WIPO) - Geneva, Switzerland 
Organisation Mondiale de la Propriete Intellectuelle (OMPI) - Geneve, Suisse 



BUNDESREPUBLIK DEUTSCHLAND 





Prioritatsbescheinigung uber die Einreichung 

einer Patentanmeldung 




Anmeldetag: 



10 2004 013 843.5 



20. Marz 2004 



Anmelder/lnhaber: 



Degussa AG, 40474 Dusseldorf/DE 



Bezeichnung: 



Expression von Nitrilhydratasen im Zwei-Vektor- 
Expressionssystem 



IPC: 



C 12 N 15/70 




Die angehefteten Stucke sind eine richtige und genaue Wiedergabe der ur- 
sprunglichen Unterlagen dieser Patentanmeldung. 





Munchen, den 21. Februar 2005 
Deutsches Patent- und Markenamt 
Der President 

Im Auftrag 




A 91 61 

03/00 
EDV-L 



040065 AM 



1 

Expression von Nitrilhydratasen im Zwei-Vektor- 

Express ions system 

Die vorliegende Erfindung bezieht sich auf ein 
Expressionsystem fur die Herstellung von Nitrilhydratasen. 
Nitrilhydratasen bestehen aus verschiedenen Untereinheiten. 
Das gegenstandliche System erlaubt die Herstellung der 
Nitrilhydratasen in gegenuber dem Stand der Technik 
verbesserter Art und Weise durch die getrennte Expression 
der Nukleinsauresequenzen kodierend fur diese Untereinheiten 
auf getrennten Plasmiden. 

Die Strukturklassen der Amide und Carbonsauren gewinnen mehr 
und mehr an Bedeutung als Vorstufen von Feinchemikalien. 
Spezielle Aminoamide und (proteinogene und nicht- 
proteinogene) Aminosauren sind Schlusselintermediate fur die 
Synthese von pharmazeutischen und agrochemischen Produkten, 
als auch im Lebensmittelbereich. Insbesondere 

enantiomerenreine Amide und Aminosauren spielen eine immer ■ 
groSer werdende Rolle in den oben genannten 
Anwendungsbereichen . 

Aminonitril-Vorstuf en, wie sie fiir die Herstellung der oben 
angegebenen Verbindungs kl as s en benotigt werden, sind in 
racemischer Form leicht uber die so genannte 
Streckersynthese zuganglich. Die so gewonnenen Nitrile 
konnen anschlieiSend mittels chemischer oder enzymatischer 
Verseifung in die entsprechenden Amide und Carbonsauren 
tiber fiihrt werden. 

Es sind drei Enzyme bekannt, die an der enzymatischen 
Hydrolyse von Nitrilen beteiligt sein konnen. Nitrilasen 
setzen eine Nitril-Funktion direkt zur Saure una, wohingegen 
Nitrilhydratasen (E.G. 4.2.1.84) hier das entsprechende Amid 
bilden. Dieses kann durch eine Amidase (E.C. 3.5.1.4) 
abschliefiend in die entsprechende Carbons aure umgesetzt 
werden (Schema 1) . 
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Nitiilhydtatas e 



Amidase 





H 



Nitrilase 



Schema 1 : 

Die Verseifung von Nitrilen zu den entsprechenden Amiden und 
Sauren mittels isolierter Enzyme oder Ganz-Zell- 
5 Katalysatoren hilft groSe Mengen Salz zu sparen, welche 
ansonsten bei dem Neutralisierungsschritt nach der 
chemischen Verseifung von Nitrilen anf alien wurden. Aus 



diesem Grund stellt die enzymatische Verseifung von Nitrilen 
zu z.B. Amino ami den und/oder Aminos aur en ein nachhaltigeres 
10 Produktionsverf ahren dar. 

Nitrilhydratasen bestehen in ihrer aktiven Form aus 2 nicht- ' 
homologen a- und p-Untereinheiten. Diese bilden 
Heterodimere, Tetramere, und bei Rhodococcus rhodochrous Jl 
wurden sogar Decamere nachgewiesen. Die a- und (3- 

15 Untereinheiten besitzen ungefahr die gleiche GroSe, haben 
aber sonst keine Ahnlichkeiten untereinander . 
Nitrilhydratasen sind Metalloproteine die Fe 3+ oder Co 3+ 
enthalten (Bunch A. W. (1998), Nitriles, in: Biotechnology, 
Volume 8a, Biotransformations I, Chapter 6, Eds.: Rehm H J , 

20 Reed G, Wiley-VCH, p. 277-324; Shearer J, Rung IY, Lovell S, 
Kaminsky W, Kovacs JA (2 001) Why is there a "inert" metal 
center in the active site of nitrile hydratase? Reactivity 
and ligand dissociation from a five-coordinate Co (III) 
nitrile hydratase model. J Am Chem Soc 123: 463-468; 

25 Kobayashi M, Shimizu S (2000) Nitrile hydrolases. Current 
Opinion in Chemical Biology 4: 95-102). 
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Eine der grofiten Her aus f orderungen bisher ist die heterologe 
Darstellung von Nitrilhydratasen in einem geeigneten Wirt, 
bevorzugt in E. coli. Dieses Gram negative Bakterium ist 
bekannt fur seine hohen Expressionsraten heterologer 
5 Proteine. Ein weiterer Vorteil ist die Ausbeute an Biomasse 
in Hoch-Zelldichte-Fermentationen mit E. coli. Hierbei 
konnen Produktivitaten von uber 100 g Biotrockenmasse (BTM) 
in 24 bis 44 Stunden erreicht werden (Lee SY (199 6) High 
cell-density culture of Escherichia coli. TIBTECH 14:98-105; 
10 Riesenberg D, Guthke R (1999) High-cell-density cultivation 
of microorganisms. Appl Microbiol Biotechnol 51:422-430). 

1 Die meisten Nitrilhydratase-Sequenzen der a- und |3- 
Untereinheit sind aus der Gattung Rhodococcus bekannt. Aber 
gerade die Expression der Nitrilhydratasen aus dieser 

15 Gattung in E. coli war bisher nur unter besonderen 

Schwierigkeiten moglich (Ikehata O, Nishiyama M, Horinouchi 
S, Beppu T (19 89) Primary structure of nitrile hydratase 
deduced from the nucleotide sequence of a Rhodococcus 
species and ist expression in Escherichia coli. Eur J 

20 Biochem 181: 563-570). 

In der Literatur sind Ein-Vektor-Expressionssysteme fur . 
Nitrilhydratasen beschrieben deren spezifische Aktivitaten 
zwischen 4,2 und 12,2 U/mg Gesamtprotein fiir Co-abhangige 
Nitrilhydratasen aus R. rhodochrous Jl (Kobayasjhi M, 

2 5 Nishiyama M, Nagasawa T, Horinouchi S, Beppu T, Yamada H 

(1991) Cloning, nucleotide sequence and expression in 
Escherichia coli of two cobalt-containing nitrole hydratase 
genes from Rhodococcus rhodochrous . Biochim Biophys Acta 
1129: 23-33) und 452 U/mg Gesamtprotein fur eine eisen- 

3 0 abhangige Nitrilhydratase aus Rhodococcus spec. N-771 liegen 

(Njori M, Yohda M, Odaka M, Matsushita Y, Tsujimura M, 
Yoshida T, Dohmae N, Takio K Endo I (1999) Functunal 
expression of Nitrile hydratases in E. coli: Requirement of 
a nitrile hydratase activator and a post-translational 
35 modification of a ligand cysteine. J Biochem 125: 696-704), 
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was ungefahr ca. 248 U/mg BTM (Biotrockenmasse) entspricht 
(Kalkulation nach Goodsell DS (1991) Inside a cell. TIBS 16: 
203-206) . Interessanterweise konnte die letztgenannte 
Aktivitat mit Nitrilhydratasen aus R. erythropolis , welche 
5 nahe verwandt sind mit Rhodococcus spec. N-711, mit 

ahnlichen Vektorsystemen und Anordnungen der Strukturgene 
nicht nachvollzogen werden . Es bestand daher immer noch ein ' 
Bedarf an Verfahren und Systemen welche es gestatten, die 
ins Auge gefassten Enzyme in fur technische MaSstabe 
10 ausreichender Art und Weise zur Verfugung zu stellen. 

Der Einsatz von Zwei-Vektor-Expressionssystemen fur die 
heterologe Expression rekombinanter Proteine in E. coli ist 
dem Fachmann bereits bekannt, wie zum Beispiel die Bildung 
des motorischen Proteins Kinesin (Skowronek K, Kasprzak A 
(2002) A two-plasmid system for independent genetic 
manipulation of subunits of homodimeric proteins and 
selective isolation of chimeric dimers . Analytical 
Biochemistry 300: 185-191), des Plaminogen-Proaktivator 
Streptokinase (Yazdani SS, Mukherjee KJ (2 002) Continuous - 
culture studies on the stability and expression of 
recombinant streptokinase in Escherichia coli; stability and 
expression of streptokinase in continuous culture. 
Bioprocess and Biosystems Engineering 24(6) : 341-346), des 
Komplexes zweier humaner Proteine (hematopoietic cell 
tyrosine phosphatase und der mitogen proteine kinase; Kholod 
N, Mustelin T (2001) Novel vectors for co-expression of two 
proteins in E. coli. 31: 322-328) oder der humanen Kreatin 
Kinase CKMB (W095/12662) zeigen. 

Bisher wurden jedoch noch keine heteromeren Enzyme die als 
Biokatalysatoren in der chemischen Industrie eingesetzt 
werden, wie z.B. die Nitrilhydratasen, mit einem solchen 
System exprimiert . 

Aufgabe war es daher ein Expressionssystem zu entwickeln, 
das es erlaubt, effizient sowohl cobalt- als auch 
eisenabhangige Nitrilhydratasen aktiv in E. coll zu 




30 



35 
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exprimieren. Insbesondere sollte das erfindungsgemafie System 
in der Lage sein, die ins Auge gefassten Enzyme in gegenuber 
dem Stand der Technik erhohter Expressionsrate und ggf - 
stabileren Formen zur Verfiigung zu stellen, urn so deren 
5 Einsatz im technischen Mafestab unter okologischen und 
Qkonomischen Gesichtspunkten vorteilhaft zu gestalten. 

Diese und weitere nicht naher spezif izierte sich jedoch aus 
dem Stand der Technik in naheliegenderweise ergebende 
Aufgaben werden durch die Angabe eines Express ions systems 
10 mit den Merkmalen des gegenstandlichen Anspruchs 1 gelost. 
Anspruche 2 bis 8 be Ziehen sich auf bevorzugte 
Ausfuhrungs formen des erf indungsgemaEen Expressionssystems . 
Anspruche 9 und 10 sind auf Verfahren zur Hers t el lung von 
Nitrilhydratasen bzw. (Amino- ) Carbons aur en oder (Amino-) 
15 Carbons aur eamide gerichtet. Anspruch 11 schutzt einen mit 
dem Express ions system ausgestatteten Wirtsorganismus . 

Dadurch, dass bei einem Expressionssystem fur die 
gleichzeitige Expression der Nukl eins aur es equenz en kodierend 
fur die verschiedenen Untereinheiten einer Nitrilhydratase 

2 0 das Expressionssystem mindestens je ein Plasmid mit 

mindestens einer Nukl eins aur es equenz kodierend fur die 
jeweilige Untereinheit aufweist, gelangt man auSerst 
vorteilhaft und nichts desto weniger vollig uberraschend zur 
Losung der gestellten Aufgabe. Mit dem vorgeschlagenen 
25 Expressionssystem ist es moglich, die heterologe Expression 
der ins Auge gefassten Nukl eins aures equenz en in fur 
technische MaSstabe ausreichender Art und Weise zu 
b ewe rkstelligen. Es kann dabei besonders uberraschen, dass 
allein die getrennte Expression der eigentlich in einem 

3 0 Operon organisierten Nukl eins aures equenz en kodierend fur die 

entsprechenden Untereinheiten der Nitrilhydratasen auf 
verschiedenen Plasmiden dazu beitragt, die Aktivitat der 
erhalt enen Nitrilhydratasen urn den Faktor > 8 gegenuber der 
„normalen w Expression zu steigern. Dies war so aus dem Stand 
3 5 der Technik in naheliegender Weise nicht herleitbar. 
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Das erf indungsgemaSe Expressionssystem kann in alien dem 
Fachmann fur den vorliegenden Zweck in Frage kommenden 
Wirtsorganismen eingesetzt werden. Als Mikroorganismen sind 
diesbeziiglich Organismen wie z.B. Hefen wie Hansenula 
5 polymorpha, Pichia sp . , Saccharomyces cerevisiae, 
Prokaryonten, wie E . coli, Bacillus subtilis oder 
Eukaryonten, wie Saugerzellen, Insektenzellen oder 
Pf lanzenzellen zu nennen. Wirtsorganismen, in die die 
Nukleinsauresequenzen aufweisende Plasmide kloniert werden 
10 kormen, dienen zur Vermehrung und Gewinnung einer 

ausreichenden Menge des rekombinanten Enzyms . Die Verfahren 
hierfur sind dem Fachmann wohlbekannt (Sambrook, J. ; 
Fritsch, E. F. und Mania tis, T. (1989), Molecular cloning: a 
laboratory manual, 2 nd ed. , Cold Spring Harbor Laboratory 
15 Press, New York) . Vorzugsweise sind E. coli-Stamme ftir 

diesen Zweck zu benutzen. Ganz besonders bevorzugt sind: E. 
coli XL1 Blue, NM 522, JM101, JM109, JM105, RRl, DH50C, TOP 
10- , HB101, BL21 codon.plus, BL21 (DE3) codon plus, BL21, 
BL21 (DE3), MM294 . Plasmide, mit denen das die 

2 0 erf indungsgemaSe Nukleinsaure aufweisende Genkonstrukt 

vorzugsweise in den Wirtsorganismus kloniert wird, sind dem 
Fachmann ebenfalls bekannt (s.a. PCT/EP03 /07148 ; s.u.). Ganz 
besonders bevorzugt ist ein Expressionssystem, das in E. 
coli BL2i als Wirt vorliegt. 

25 Promo tor en sind DNA-Sequenzbereiche, von denen aus die 

Transkription eines Gens oder Operons gesteuert wird. Die 
fur die Ausfiihrung der Erfindung besonders vorteilhaf ten 
Promotoren, welche insbesondere in E. coli einzusetzen sind, 
sind dem Fachmann bekannt (Sambrook, J.; Fritsch, E. F. und 

30 Maniatis, T . (1989), Molecular cloning: a laboratory manual, 
2 nd ed. , Cold Spring Harbor Laboratory Press, New York ) . Es 
hat sich jetzt als vorteilhaft erwiesen, wenn die Expression 
der Nukleinsauresequenzen kodierend fur die Untereinheiten 
unter der Kontrolle von jeweils dem gleichen Promotor steht, 

3 5 damit die Nukleinsauresequenzen kodierend fur die 

Untereinheiten in moglichst gleicher Geschwindigkeit 
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exprimiert werden konnen . Geeignete Promotoren konnen solche 
ausgewahlt aus der Gruppe T7 , lac, tac, trp, ara oder 
rhamnose induzierbare sein. Weitere sind in (Cantrell, SA 
(2003) Vectors fort he expression of recombinant proteins in 
5 E. coli. Methods in Molecular biology 23 5: 2 57-275; Sawers, 1 
G; Jarsch, M (1996) Alternative principles for the 
production of recombinant proteins in Escherichia coli. 
Applied Microbiology and Biotechnology 46(1): 1-9) genannt. 
Ganz besonders bevorzugt ist der Einsatz des so genannten 
10 T7-Promotors im erf indungsgemaSen Express ions system 

(Studier, W. F . ; Rosenberg A. H. ; Dunn J. J.; Dubendroff J. 
W. ; (1990), Use of the T7 RNA polymerase to direct 
expression of cloned genes, Methods Enzymol . 185, 61-89; 
oder Broschuren der Firmen Novagen oder Promega) . 

15 Es hat sich als fur die Funktionsf ahigkeit des 

erf indungsgemaSen Express ions systems nutzlich erwiesen, dass 
auf den entsprechenden Plasmiden bestimmte 
Nukleinsauresequenzen vorhanden sind, die fur als 
Helf erproteine bekannte Peptidsequenzen kodieren und deren ■ 

2 0 Funktionen bisher weitgehend unbekannt sind. Diese sind dem 

Fachmann im Hinblick auf die Erzeugung aktiver 
Nitrilhydratasen bekannt (Nojiri M; Yohda M; Odaka M; 
Matsushita Y; Tsujimura M; Yoshida T; Dohmae N; Takio K; 
Endo I (1999) Functional expression of nitrile hydratase in 
Escherichia coli: requirement of a nitrile hydratase 
activator and post-translational modification of a ligand 
cysteine. Journal of biochemistry 125(4): 696-704). Ganz 
besonders bevorzugt ist ein Express ions system, bei dem pro 
eingesetztem Plasmidsatz mindestens eine Nukleinsauresequenz 

3 0 kodierend fur ein solches Helf erprotein, insbesondere das 

p47K- (Seq. ID No. 33) oder pl2K-Protein (Seq. ID No. 31), 
vorhanden ist. Ein Plasmidsatz bezeichnet dabei die Plasmide 
die erf indungsgemaS notwendig sind, eine aktive 
Nitrilhydratase aufzubauen. 
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Wie Eingangs naher erlautert sind Nitrilhydratasen aus 
verschiedenen Organismen bekannt (s.a. PCT/EP04/00338 ; Diss, 
s.o.). Vorzugsweise werden in dem erf indungsgemaSen 
Expressionssystem jedoch solche Nukl eins aur es equenz en 
5 verwendet, die fur Untereinheiten von Nitrilhydratasen 
kodieren, welche ihren Ur sprung in Nitrilhydratasen aus 
Rhodococcus-Stammen haben. Die eingesetzten 
Nukleinsauresequenzen konnen dabei gegenuber den 
Ursprungss equenz en aus Rhodococcus durch Mutagenese auf 
10 chemischer oder molekularbiologischer Basis verandert sein. 
Es kommen dabei insbesondere solche Nukleinsauresequenzen in 
Betracht, die fur Untereinheiten kodieren, die gegenuber den 
Wildtyps equenz en im Hinblick auf Aktivitat und/oder 
Selektivitat und/oder Stabilitat verbessert sind. Die 
15 Verbesserung der Aktivitat und/oder Selektivitat und/oder 
Stabilitat bedeutet erf indungsgemaS, dass die ins Auge 
gefassten Enzyme aktiver und/oder selektiver bzw. weniger 
selektiv oder unter den verwendeten Reaktionsbedingungen 
stabiler sind. Wahrend die Aktivitat und die Stabilitat der 1 
2 0 Enzyme fur die technische Anwendung naturgemaE moglichst 

hoch sein sollte, ist in Bezug auf die Selektivitat dann von 
einer Verbesserung die Rede, wenn entweder die 
Substratselektivitat abnimmt, die Enantioselektivitat der 
Enzyme jedoch gesteigert ist. 
2 5 Die Vorgehensweise zur Verbesserung der erf indungsgemaSen 
Nukleinsauresequenzen bzw. der durch sie codierten 
Polypeptide durch Mutagenese-Methoden ist dem Fachmann 
hinlanglich bekannt. Als Mutagenese-Methoden kommen alle dem 
Fachmann fur diesen Zweck zur Verfugung stehenden Methoden 
30 in Frage. Insbesondere sind dies die Sattigungsmutagenese, 
die Random-Mut agenesis, in vitro-Rekombinat ions -Methoden 
sowie Site-Directed-Mutagenesis (Eigen, M. und Gardiner, W. 
(1984) , Evolutionary molecular engineering based on RNA 
replication, Pure Appl . Chem. 56, 967-978; Chen, K. und 
35 Arnold, F. (1991), Enzyme engineering for nonaqueous 
solvents: random mutagenesis to enhance activity of 
subtilisin E in polar organic media. Bio /Technology 9, 1073- 
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1077; Horwitz, M. und Loeb, L. (1986), Promoters Selected 
From Random DNA- Sequences , Proc Natl Acad Sci USA 83, 7405- 
7409; Dube, D. und L. Loeb (1989), Mutants Generated By The . 
Insertion Of Random Oligonucleotides Into The Active-Site Of 
5 The Beta-Lactamase Gene, Biochemistry 28, 5703-5707; 

Stemmer, P.C. (1994), Rapid evolution of a protein in vitro 
by DNA shuffling, Nature 370, 3 89-391 und Stemmer, P.C. 
(1994) , DNA shuffling by random fragmentation and 
reassembly: In vitro recombination for molecular evolution. 
10 Proc Natl Acad Sci USA 91, 10747-10751) . 

Besonders bevorzugt stammen die Nukl e ins aur es equenz en 
kodierend fur die Untereinheiten der Nitrilhydratasen aus 
Rhodococcus- Stammen, insbesondere R. erythropol i s 870-AN019. 

In einer weiteren bevorzugt en Ausf uhrungsf ormen werden die 
15 eingesetzten Nukl eins aur es equenz en dahingehend verander t , 
dass sie der „codon usage" von E. coli besonders gut 
entsprechen. Es hat sich gezeigt, dass je mehr der Codon- 
Gebrauch des zu exprimierenden Gens dem von E . coli 
entspricht, die Ausbeuten der gewonnenen Enzyme weiter 

2 0 gesteigert werden konnen. Besonders bevorzugt ist es 

deshalb, die Nukl eins aur es equenz en kodierend fur die 
Untereinheiten der Nitrilhydratasen entsprechend der „codon 
usage" von E. coli zu modif izieren. Unter „codon usage" wird 
die Tats ache verstanden, dass unterschiedliche Organismen 
25 unterschiedliche Basentripletts , welche fur die gleichen 

Aminos aur en kodieren (Degeneration des genetischen Code) , in 
unterschiedlicher Auspragung gebrauchen. 

Als Plasmide bzw. Vektoren kommen im Prinzip alle dem 
Fachmann fur diesen Zweck zur Verfiigung stehenden 

3 0 Ausf uhrungsf ormen in Frage. Derartige Plasmide und Vektoren 

konnen z. B. von Studier und Mitarbeiter (Studier, W. F.; 

i 

Rosenberg A. H.; Dunn J. J.; Dubendroff J. W. ; (1990), Use 
of the T7 RNA polymerase to direct expression of cloned 
genes, Methods Enzymol . 185, 61-89) oder den Broschuren der 
35 Firmen Novagen, Promega, New England Biolabs, Clontech oder 
Gibco BRL entnommen werden. Weiter bevorzugte Plasmide und 
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Vektoren konnen gefunden werden in: Glover, D. M. (1985), 
DNA cloning: a practical approach, Vol. I-III, IRL Press 
Ltd., Oxford; Rodriguez, R.L. und Denhardt, D. T (eds) 
(1988), Vectors: a survey of molecular cloning vectors and 
their uses, 179-204, Butterworth, Stoneham; Goeddel, D. V. 
(199 0) , Systems for heterologous gene expression, Methods 
Enzymol . 185, 3-7; Sambrook, J.; Fritsch, E. F. und 
Maniatis, T. (1989) , Molecular cloning: a laboratory manual, 
2 nd ed. , Cold Spring Harbor Laboratory Press, New York. 
Plasmide, mit denen die die Nukleinsauresequenzen 
aufweisenden Genkonstrukte kodierend fur die Untereinheiten 
in ganz bevorzugter Weise in den Wirtsorganismus kloniert 
werden konnen, sind: pUC18/19 (Roche Biochemicals ) , pKK-177- 
3H (Roche Biochemicals) , pBTac2 (Roche Biochemicals) , 
pKK2 23-3 (Amersham Pharmacia Biotech) , pKK-233-3 
(Stratagene) oder pET (Novagen) . Ganz besonders bevorzugt 
ist ein Expressionssystem auf Basis von Plasmide der pET- 
Reihe. AuSerst bevorzugt ist der Einsatz von Plasmiden der 
gleichen Reihe sowohl fur die Expression der 

Nukl einsaur es equenz kodierend fur die a- und p-Untereinheit . 

In einer weiteren Ausgestaltung bezieht sich die vorliegende 
Erfindung auf ein Verfahren zur Herstellung von 
Nitrilhydratasen. Das Verfahren ist dadurch gekennzeichnet , 
dass es unter Verwendung eines wie oben darges tell ten 
erf indungsgemaSen Expressionssys terns durchgefuhrt wird. 

In einer bevorzugten Ausf uhrungsf ormen wird das 
erf indungsgemaSe Verfahren so durchgefuhrt, dass die 
Expression bei Inkubationstemperaturen von kleiner 3 0 Grad 
Celsius, bevorzugt kleiner 25 Grad Celsius und ganz 
3 0 besonders bevorzugt < 20 Grad Celsius durchgefuhrt wird. 

Weiterhin vorteilhaft ist die Ausgestaltung, bei der wahrend 
der Expression zum Medium Alkohole, insbesondere Ethanol, in 
einer Konzentration von kleiner 10% (w/w) , bevorzugt kleiner 
5% (w/w) und ganz besonders bevorzugt 2-4% (w/w) zugegeben 
35 wird. Durch diese MaSnahmen wird erreicht, dass bei dem 
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erf indungsgemaSen Verfahren zur Herstellung der 
Nitrilhydratasen unlosliche Proteine (inclusion bodies), 
welche keine Aktivitat entfalten, nicht oder nur in 
vermindertem MaSe gebildet werden. 

5 In einer nachsten Ausgestaltung bezieht sich die vorliegende 
Erfindung auf einen Wirtsorganismus aufweisend ein 
erf indungsgemaSes Express ions system. Wie weiter oben schon 
angedeutet konnen die Nukleinsaureseguenzen kodierend fur 
die Untereinheiten von Nitrilhydratasen in wie oben 
10 geschilderter erf indungsgemaEer Art und Weise in Plasmide 
integriert und in Wirtsorganismen trans formiert werden. 
Zusatzlich kann neben dem erf indungsgemafeen 

Express ions system in dem Wirtsorganismus auch klonierte Gene 
fur eine ggf . stereoselektiv arbeitende Amidase (z.B. die 
15 aus WO2004/005517 oder EP 1318193) vorhanden sein. Ein so 
hergestellter Ganzzellkatalysator kann vorteilhaf terweise 
beide am Nitril-Abbau beteiligten Enzyme produzieren, womit 
sichergestellt ist, dass das eingesetzte Nitril sofort zur 
entsprechenden Carbonsauren umgewandelt wird. 

2 0 Ganzzellkatalysator en, welche mehrere an einer 

Reaktionskaskade beteiligte Enzyme enthalten, sind bereits 
bekannt (EP12163 04) . Deren Einsatz in der gegenstandlichen 
Erfindung erfolgt in aquivalenter Art und Weise. 

•Werden Rhamnose indizierbare Promotoren verwendet so sollte 
2 5 ein Organismus wie in der DEI 015592 8 genannt als 

Wirtsorganismus oder Ganzzellkatalysator eingesetzt werden. 
Weiterhin vorteilhaft ist der Einsatz eines E. coli BL21 
codon plus, der ggf. gemaK dem der DE10155928 in 
aquivalenter Weise modifiziert ist. 

3 0 Urn die Expression der Enzyme im Hinblick auf ihre 

Umsetzungsgeschwindigkeiten abzustimmen, konnen die jeweils 
fur die Nitrilhydratase und die Amidase codierenden 
Nukleinsauresequenzen entsprechend ihren Umsetzungsraten in 
unterschiedliche Plasmide mit unterschiedlichen Kopienzahlen 
35 kloniert und/oder unterschiedlich starke Promotoren fur eine 
unterschiedlich starke Expression der Nukleinsauresequenzen 
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verwendet werden . Bei derart abgestimmten Enzymsystemen 
tritt vorteilhaf terweise eine Akkumulation einer ggf . 
inhibierend wirkenden Zwischenverbindung nicht auf und die 
betrachtete Reaktion kann in einer optimalen 
5 Gesamtgeschwindigkeit ablaufen. Dies ist dem Fachmann jedoch 
hinlanglich bekannt (Gellissen, G. ; Piontek, M..; Dahlems, 
U.; Jenzelewski, V.; Gavagan, J. W. ; DiCosimo, R. ; Anton, D. 
L . ; Janowicz, Z. A. (1996), Recombinant Hansenula polymorpha 
as a biocatalyst. Coexpression of the spinach glycolate 
10 oxidase (GO) and the S. cerevisiae catalase T (CTTl) gene, 

Appl . Microbiol. Biotechnol . 46, 46-54; Farwick, M. ; London, 
M. ; Dohmen, J".; Dahlems, U. ; Gellissen, G. ; Strasser, A. W. ; 
DE19920712) . 

Die Herstellung eines derartigen Ganzzellkatalysators ist 
15 dem Fachmann ebenfalls bekannt (Sarabrook, J.; Fritsch, E. F. 
und Maniatis, T . (1989), Molecular cloning: a laboratory 
manual, 2 nd ed. , Cold Spring Harbor Laboratory Press, New 
York; Balbas, P. und Bolivar, F. (1990), Design and 
construction of expression plasmid vectors in E.coli, 

2 0 Methods Enzymol. 185, 14-3 7; Rodriguez, R.L. und Denhardt, 

D. T (eds) (1988), Vectors: a survey of molecular cloning 
vectors and their uses, 2 05-225, Butterworth, Stoneham) . 

Eine weitere Ausgestaltung der gegenstandlichen Erfindung 
bezieht sich auf ein Verfahren zur Herstellung von, ggf. 
25 enan t i omer enanger ei chert en , (Amino- ) Carbons aur en oder 

(Amino-) Carbons aur eaureami den. Auch dieses Verfahren wird 
unter Verwendung eines wie oben darges tell ten 
Wirtsorganismus durchgef uhrt . Das bedeutet, dass die an der 
Herstellung der Carbons aur en oder Carbonsaureamiden 

3 0 beteiligten Nitrilhydratasen durch ein wie eben 

darges tellten Wirtsorganismus gewonnen werden. 
Fur die Anwendung konnen die betrachteten Enzyme in freier 
Form als homogen auf gereinigte Verbindungen oder als 
rekombinant (rec-) hergestelltes Enzym verwendet werden. 
3 5 Weiterhin konnen die Enzyme auch als Bestandteil eines 

intakten Gastorganismus eingesetzt werden oder in Verbindung 
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mit der aufges chlos senen und beliebig hoch auf gereinigten 
Zellmasse des Wirtsorganismus . 

Moglich 1st ebenfalls die Verwendung der Enzyme in 
immobilisierter Form (Sharma B. P.; Bailey L. F. und Messing 
5 R. A. (1982), Immobilisierte Biomaterialiern - Techniken und 
Anwendungen , Angew. Chem. 94, 83 6-852) . Vorteilhaf terweise 
erfolgt die Immobilisierung durch Lyophilisation (Paradkar, 
V. M. ; Dordick, J. S. (1994), Aqueous-Like Activity o£ 
Chymotrypsin Dissolved in Nearly Anhydrous Organic Solvents, 
10 J. Am. Chem. Soc. 116, 5009-5010; Mori, T . ; Okahata, Y. 

(1997), A variety of lipi-coated glycoside hydrolases as 
effective glycosyl transfer catalysts in homogeneous organic 
solvents, Tetrahedron Lett. 38, 1971-1974; Otamiri , M. ; 
Adlercreutz, P.; Matthiasson, B. (1992), Complex formation 
15 between chymotrypsin and ethyl cellulose as a means to 

solbilize the enzyme in active form in toluene, Biocatalysis 
6, 291-305) . Ganz besonders bevorzugt ist die Lyophilisation 
in Gegenwart von oberf lachenaktiven Substanzen, wie Aerosol 
OT oder Polyvinylpyrrolidon oder Polyethylenglycol (PEG) 
20 oder Brij 52 (Diethylenglycol-mono-cetylether ) (Kamiya, N. ; 
Okazaki, S.-Y.; Goto, M. (1997), Surfactant-horseradish 
peroxidase complex catalytically active in anhydrous 
benzene, Biotechnol . Tech. 11, 375-378). 

AuSerst bevorzugt ist die Immobilisierung an Eupergit® , 
25 insbesondere Eupergit C® und Eupergit 250L® (Rohm) 

(Eupergit .RTM. C, a carrier for immobilization of enzymes of 
industrial potential. Katchalski-Katzir , E. ; Kraemer, D. M. 
Journal of Molecular Catalysis B: Enzymatic (2000), 10(1- 
3) , 157-176. ) . 

3 0 Gleichfalls bevorzugt ist die Immobilisierung an Ni -NT A in 
Kombination mit dem His-Tag (Hexa-Histidin) er ganz ten 
Polypeptid (Purification of proteins using polyhistidine 
affinity tags. Bornhorst, Joshua A.; Falke, Joseph J. 
Methods in Enzymology (2000), 326, 245-254) .Die Verwendung 

35 als CLECs ist ebenfalls denkbar (St. Clair, N. ; Wang, Y.-F.; 
Margolin, A. L. (2 000) , Cof actor-bound cross-linked enzyme 
crystals (CLEC) of alcohol dehydrogenase, Angew. Chem. Int. , 
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Ed. 39, 380-383) . 

Durch diese Mafenahmen kann es gelingen aus Polypeptiden 
(Enzymen) , welche durch organische Solventien instabil 
wer den , solche zu generieren, die in Gemischen von wassrigen 
5 und organischen Losungsmitteln bzw. ganz in Organik stabil 
sind und arbeiten konnen. 

In den nachs t ehenden Experiment en wer den folgende Stamme 
verwendet : 

Liste der Verwendeten Stamme, (Brandao PFB, Clapp JP and 
10 Bull AT (2 002) . Discrimination and taxonomy of 

geographically diverse strains of nitrile-metabolising 
actinomycetes using chemometric and molecular sequencing 
techniques. Environmental Microbiology 4, 2 62-27 6; s.a. 
PCT/EP04/00338) . 

15 Tabelle 1: 



Isolat 


DSM 


oc-Untereinheit 
Seq. Nr. 


(3-Untereinheit 
Seq. Nr. 


R. erythropolis 
870-AN019 


15258 


1 


3 

« 


R. erythropolis 
ENG-AN033 


15261 


5 


7 


R. erythropolis 
871-AN042 


15265 


9 


11 


JR. rhodochrous 
M8 


Russian 
National 
Collection 
of Micro- 
organisms 
VKPM-S-92 6 


13 


15 
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Fur die blunt-end Klonierung der Nitrilhydratasen und des 
p47K Proteins (Seq. ID No. 33) in pUCl8/19 (xSmal) (Abb. 1) 
aus den oben genannten Stammen wurden folgende Primer 
benutzt : 



Primer 


Primers equenz 


Amlif izierte 
Untereinheiten 


Seq . Nr . 


NH-Re-N 


5'-GCC CGC ATA AGA AAA GGT GAA C 


a, p, p47K 


17 


NH-Re~C-p47K 


5'-GCA TGC CTT CAA ATC AGC CTG 


a, (3, p47K 


18 



Die ersten Expressionsexperimente im Ein-Vektor- 
Expressionssystem rait Nitrilhydratasen aus den R. 
erytJiropolis-Stammen 870-AN019, 871-AN042 und ENG-AN033 
wurden mit Plasmiden der pUCl8/19 Reihe in verschiedenen E. 

10 coli-Stammen durchgef uhrt . Um den optimalen Expressionswirt 
ermitteln zu konnen wurden die pUC18/19 Konstrukte mit den 
Nitrilhydratasen aus R. erythropol is-Stammen 870-AN019, 871- 
AN042 und ENG-AN033 in verschiedene E. colics trans formiert 
und unter der Kontrolle des lac- Promotors exprimiert. Es 

15 handelte sich dabei um folgende E. coli-Stamme: JM109, 
DH50C, BL21 codon plus, BL21, HB101, MM294 und XLlblue . 

Die Aktivitaten (Units pro g Zelltrockenmasse) der 
rekombinanten Nitrilhydratasen in den verschiedenen Wirt en 
lassen sich wie folgt zusammenf assen: Es zeigte sich, dass 

20 die hochste Aktivitat mit E. coll BL21 codon plus RIL (Firma 
Stratagen) erhalten wurde, in dem die Kopienzahl der fur E. 
coll seltenen t-KWA's fur Arginin (AGA/AGG) , Isoleucin (AUA) 
und Leucin (CUA) erhoht vorliegen. Dieser Wirtsorganismus 
ist konstruiert worden, um speziell Gene mit einer an einen 

25 hohen GC-Gehalt angepassten „codon-usage" zu exprimieren, 
wie z.B. die aus Rhodococcen (72% GC) . 

Die Nitrilhydratase aus JR. erythropolls 870-AN019 in E. coll 
BL21 codon plus zeigt mit groEem Ab stand die hochste 
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Aktivitat von 100 U/g BTM, gefolgt von Nitrilhydratasen 87 0- 
AN019 in DH50G (8 U/g BTM) und Nitrilhydratasen ENG-AN033 in 
BL21 codon plus (7 U/g BTM) . 

Die Aktivitaten aller anderen rekombinanten Organismen lagen 
5 unter 2 U/g BTM oder waren nicht nachweisbar. Unter 

optimierten Bedingungen wurde sogar fur die Nitrilhydratase 
870-AN019 eine Aktivitat von 280 U/g BTM erreicht. 

Im folgenden wurde die Expression von eisenabhangigen 
Nitrilhydratasen im Zwei-Vektor-Express ions system 

10 durchgefuhrt , wobei a- und P-Untereinheiten getrennt auf je 
einem Plamid vorlagen. Vorteil dieses Systems ist es, dass 
die beiden Untereinheiten jeweils direkt unter der Kontrolle 
des ggf . eingesetzten T7 -Promoters liegen und somit die 
Transkripte fur die Gene gleich stark gebildet werden. Das 

15 p47K-Helf erprotein (Seq. ID No. 33) war von Fall zu Fall 
einem der beiden Untereinheiten nachgeschaltet . Als 
Expresssionsvektoren dienten Plasmide der pET-Reihe (pET22b 
und pET2 6b) der Firma Stratagene. es wurde die Expression 
der Nitrilhydratase aus R. erythropolis 870-AN019 (Seq. Nr. 

2 0 1 und 3) angestrebt. 

Fur die Klonierung der beiden Untereinheiten und des p47K 
Proteins (Seq. ID No. 33) wurden folgende Primer benutzt: 



Primer 


Pr imer s equenz 


Amplif i- 
zierter Orf 


Seq. Nr. 


NH019-a-for- 
Nde 


5'-AGG GTG AAC CAT ATG 
TCA GTA ACG 


a 


19 

* 


NH019-a-rev- 
Bam 


5'-TGT CGG ATC CAT CAG 
ACG GTG G 


a 


20 


NH019-(i~for- 
Nde 


5 ' - AGC ACC ATA TGG ATG 
GAG TAC AC 


p 


21 


NH019-p-rev- 


5'-GTT GGG AAT TCA GGC 


p 


22 
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ECO 


CGC AGG 






NH019~p47K~ 
f or- Bam 


5'-CGC GGA TCC AAG AAG 
GAG ATA TAC ATG 


p47K 


23 


NH019~p47K- 
rev-Hind 


5'-CCG CAA CGT TCA AAC 
GGT CTG G 


p47K 


24 



Fur die a- unci (3-Untereinheit wurden Primer von der 
Nitrilhydratasesequenz aus JR. erythropolis 87 0-AN019 
abgeleitet (Brandao PFB, Clapp JP, Bull AT (2003) Diversity, 
5 of nitrile hydratase and amidase enzyme genes in Rhodococcus 
erythropoli recovered from geographically distinct' habitats. 
Applied and Environmental Microbiology 69(10): 5754-5766; 
s.a. PCT/EP04/00338) , welche mit Schnittstellen fur die 
Restriktionsendonukleasen NdoX (N-Terminal) bzw: BairiRX (oc- 

10 Untereinheit) oder EcoRI ((3-Untereinheit ) C- Terminal 

versehen war en. Die Primer fur p47K wurden ebenf alls von 
dies em Organismus abgeleitet und enthielten die 
Schnittstellen fur BairiRX (N- terminal) bzw. HiriDXXX (C- 
terminal) . Die p-Untereinheit wurde in pET2 6b, die a- 

15 Untereinheit und p47K zusammen in pET22b kloniert. Es 

resultierten folgende Plasmide, welche in E. coli BL21 Codon 
( + ) RIL trans formiert wurden (siehe auch Abb. 2/3) . 

Verglichen wurden die Aktivitaten der Nitrilhydratase aus R. t 
erythropolis 87 0-AN019 in den E. coli-Stammen BL21 und BL21 

2 0 codon plus RIB (siehe oben) . Mit dem oben beschriebenen 

Expressionssystem wurden Aktivitaten von ca. 1750 U/g BTM 
mit E. coli BL21 erreicht und 2750 U/g BTM mit mit E. coli 
BL21 codon ( + ) (bezogen auf Benzonitril als Substrat) . Dies 
bedeutet eine Steigerung gegenuber den Ein-Vektor- 

25 Express ionssystemen urn den Faktor 5,3 bis 8,3. 

50% des rekombinanten Proteins in der Zelle lagen hier 
allerdings als sogenannte „ inclusion bodies* vor. Zur 
weiteren Verbesserung der Aktivitaten der Nitrilhydratasen 
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wurden Parameter wie IPTG-Konzentration, Temperatur wahrend 
der heterologen Expression und Zusatz von Additiven ins 
Medium untersucht . Die Verminderung der IPTG-Konzentration 
hatte keinen Einf luss auf die Loslichkeit der rekombinanten < 
5 Nitrilhydratasen. Daher wurden alle weiteren Experimente mit 

1 mM IPTG durchgef uhrt . Den groEten Effekt auf die 
Verminderung der „ inclusion body* -Bildung hatte die 
Absenkung der Inkubat ions temperatur . 

Durch die Reduktion der Temperatur bis auf 2 0°C nach 
10 Induktion der heterologen Expression konnte ein groEer 

Anteil des Enzyms in die losliche Fraktion uberfuhrt werden^ 
Ein zusatzlichen positiven Effekt hatte die Zugabe von 3% 
Ethanol zum Medium. Unter diesen Bedingungen (1 mM IPTG, 
20°C Inkubations temperatur , 3% Ethanol zusatz ) konnte eine 
15 Aktivitat von 6480 U/g BTM erreicht werden. 

Eine weitere Erhohung der Aktivitat wurde durch die Nutzung 
eines synthetischen Gens der Nitrilhydratase 87 0-AN019 
erreicht. Hergestellt wurden die entsprechenden 
Nukleinsauresequenzen kodierend fiir die a- und p- 

2 0 Untereinheiten unter Berucksichtigung der „codon usage* von 

E. coli und unter Beibehaltung der Aminosaureabf olge der 
beiden Gene. Vorteil dieser synthetischen Gene sollte sein, 
dass die DNA-Sequenz optimal fiir eine Expression in E. coli 
angepasst ist und somit auch die Nutzung des sogenannten 
25 „codon plus* Stammes entf alien kann. Die Untereinheiten 
wurden dann wie schon zuvor beschrieben getrennt in pET- 
Vektoren kloniert und unter den oben optimierten Bedingungen 
in E. coli BL21 exprimiert. Mit diesem Stamm wurde eine 
Aktivitat von ca. 10.000 U/g BTM erreicht. Somit ist er mehr 

3 0 als doppelt so aktiv wie der Wildtyp R . erythropolis 87 0- 

AN019, der eine Aktivitat von ca. 4760 U/g BTM mit 
Benzonitril als Substrat besitzt. Eine Zusammenf assung uber 
die erreichten Aktivitaten gibt die Tabelle 2 . 

Die synthetischen Nitrilhydratase macht in dem E. coli-Wirt 
3 5 ca. 5 0% des gesamten gebildeten Zellproteins aus, wobei ca. 

2 0% als gelostes rekombinantes Protein vorliegen. 
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Tabelle 2 : Ubersicht uber die gemessenen Nitrilhydratase- 
Aktivitaten mit den unterschiedlichen Expressionssystemen . 



system 

(Wirt & 
Promoter) 


Express ionsbedingungen Nitrilhydratase aus 87 0- 
AN019 


Native 

Untereinheiten, 
Standardmedium, 
26°C 


Native 

Untereinheiten, 
Medium + 3% 
EtOH, 20°C 


Synthetische 
Untereinheiten 
Medium +3% 
EtOH, 20°C 


E. coli BL21 
(DE3) & T7 
Promoter 


1750 U/g BTM 




10080 U/g BTM 


E. coli BL21 
(DE3) codon 
usage & T7 
Promoter 


2750 U/g BTM 


6480 U/g BTM 





AbschlieSend wurde die Expression von cobaltabhangigen 
5 Nitrilhydratasen im Zwei ~ Vekt or- Expr es s i ons sy s t em 
untersucht. Die cobalt abhangige Nitrilhydratase aus 
Rhodococcus rhodochrous M8 (Pogorelva TE, Ryabchenko LE, 
Sunzov NI , Yanenko AS (1996) Cobalt -dependent transcription 
of nitrile hydratase gene in Rhodococcus rhodochrous M8 . 
10 FEMS Microbiology Letters 144: 191-195) wurde kloniert und 
mit dem oben beschriebenen erf indungsgemaSen 
Expressionssystem hergestellt. 
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Die Sequenz der Nitrilhydratase (Seq. ID No. 13 und 15) ist 
bei GenBank (DNA Datenbank von DDBJ, EMBL und NCBI) unter 
der Kennung X8 6737 hinterlegt und frei zuganglich. Zur 
Klonierung der einzelnen Untereinheiten und des pl2K- 
5 Proteins aus R. rhodochrous M8 (Seq. ID No. 31) wurden 
folgende Primer benutzt: 



Primer 


Primer sequenz 


Amlif izierte 
Untereinheiten 


Seq. Nr. 


M8~a-f or-Nde 


5'-AGG AAT ACG CAT ATG AGC 
GAGC ACG TC 


a 


25 


M8- a- rev- Bam 


5' -GTG TGG ATC CAC TCA TAC 
GAT CAC TTC CTG 


a 


26 


M8~p~f or-Nde 


5 ' - AGG AAT GAG CAT ATG GAT 
GGT ATC CAC GAC A 


P 


27 


M8-p-rev-Bam 


5 ' -ATC GGG ATC CTT TCA CGC 
AGA GAT CAG GTA CGG 


P 


28 


M8-pl2K-for- 
Bam 


5 ' -CTC AGG ATC CAA GGA GTG 
ATC GTA TGA GTG AAG AC 


p!2K 


29 


M8-pl2K-rev- 
Sac 


5'-ACA GGA GCT CTC AGT CGA 
TGA TGG CC 


p!2K 


30 



Fur die a- und p-Untereinheit wurden Primer von der 
Ni t r i lhydr a t as es equenz aus M8 abgeleitet, welche mit 
10 Schnittstellen fur die Restriktionsendonukleasen JOTciel (N- 

Terminal) bzw: BamH.1 (C-Terminal) versehen war en. Die Primer 

i 

fur pl2K wurden von der Sequenz von R. rhodochrous Jl 
abgeleitet und enthielten die Schnittstellen fur BamHI (N- 
terminal) bzw. SacI (C-terminal) . Die (3-Untereinheit (Seq. 
15 ID No. 15) wurde in pET2 6b, die a-Untereinheit (Seq. ID. 
No. 13) und pl2K (Seq. ID No. 31) in pET22b kloniert . Es 
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resultierten folgende Plasmide, welche in E. coll BL21 
Codon(-f) RIL trans formiert wurden (Abb. 4/5) . 

Im Gegensatz zur Expression von eisenabhangigen 
Nitrilhydratasen in E. coll, musste im Fall der 
5 cobaltabhang : igen Nitrilhydratase die Zellen iiber mehrere 

Generationen vorkultiviert werden, um diese an das toxische 
Cobalt (0,5 mM eingesetzt) zu gewohnen . 

In Tabelle 3 sind die Aktivitaten der rekombinanten 
cobaltabhangigen {R. rhodochrous M8) und eisenabhangigen (R. 
10 erythropoli 870-AN019) Nitrilhydratasen im Vergleich 
dargestellt . 

Tabelle 3 : Gemessene Aktivitaten der cobalt- und 
eisenabhangigen Nitrilhydratase nach erf indungs gemafier 
Expression mit Acrylamid als Substrat. 



Rekombinante Nitrilhydratase 
aus 


Aktivitat (U/mg) ; 
Substrat Acrylamid 


R . rhodochrous M8 (Co) 


160 


R. erythropolis 87 0-AN019 
(Fe) 

(synthetisch s.o.) 


250 



15 

Damit konnte gezeigt werden, dass das erf indungs gema.Se 
Expressionssystem sowohl fur cobalt- als auch fur 
eisenabhangige Nitrilhydratasen im vorteilhaf ter Art und 
Weise zu gebrauchen ist. Es konnen insbesondere darmatische 

2 0 Aktivitatssteigerungen erzielt werden, wenn die 

Expressionssysteme und/oder Sequenzen entsprechend optimiert 
werden. Durch die erfolgreiche getrennte Expression der 
Untereinheiten der Nitrilhydratase ist es daruber hinaus 
moglich neue Kombinationen von Untereinheiten verschiedener 

25 Nitrilhydratasen zu untersuchen, was die Diversif ikation der 
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Nitrilhydratasen und damit deren Eigenschaf ten steigern 
hilft.Dies war so aus dem Stand der Technik zum Zeitpunkt 
der Erfindung in naheliegender Weise nicht ableitbar. 

Unter optisch angerei chert en (enantiomerenangerei chert en, 
5 enantiomer angerei chert en) Verbindungen wird im Rahmen der 
Erfindung das Vorliegen einer optischen Antipode im Gemisch 
mit der anderen in >5 0 mol-% verstanden. 

< 

Unter dem Begriff Nukleinsauresequenzen werden alle Arten 
von einzelstrangiger oder doppelstrangiger DNA als auch RNA 
10 oder Gemische derselben subsumiert. 

Die Organismen 870-AN019, ENG-AN033 und 871-AN042 wurden bei 
der Deutsche Sammlung fur Mikroorgansimen und Zellkulturen, 
Mascheroder Weg 4, 3 8124 Braunschweig gemaS dem Budapester 
Vertrag durch die Anmelderin am 22 .10.2002 hinterlegt. 

■ 

15 Der organismus Rhodococcus rodochrous M8 ist in der All- 
Russian National Collection of Microorganisms unter der 
Nummer VKPM-S-92 6 hinterlegt. Die entsprechenden Sequenzen 
konnen der Gendatenbank (s.o.) entnommen werden. 

Der terminus Express ions system wird erf indungsgemaS so 
20 verstanden, dass es sich dabei urn biologisches Material auf 
Nukleinsaurebasis handelt, welches im Stande ist, in 
Organismen die Expression der ihm innewohnenden 
Nukleinsauresequenzen kodierend fur die Nitrilhydratase- 
Unterheiten zu bewerkstelligen . Insbesondere sind dies 
2 5 Plasmide und Vektoren. 

Im Rahmen der Erfindung werden die Ausdrucke Protein und 
Polypeptid synonym benutzt. 
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Beschreibung der Abbildungen: 

Abbildung 1: Die Vektorkarte zeigt die allgemeine Anordnung 
der a- und p-Untereinheiten der Nitrilhydratase bzw. des 
Orf 's p47K im Plasmid pUCl8 in einem Express ions system mit 
5 einem Vektor . 

Abbildung 2/3: Die Vektorkarten zeigen die Anordnung der a~ 
und p-Untereinheiten der Nitrilhydratase bzw. des Orf's p47K 
aus R. erythropolis 87 0-AN019 in Plasmiden der pET-Reihe in 
einem Express ionssys tern mit zwei Vektoren. 

10 Abbildung 4/5: Die Vektorkarten zeigen die Anordnung der oc~ 
und (3-Untereinheiten bzw. des Orf's pl2K aus R. rhodochrous 
M8 in Plasmiden der pET-Reihe in einem Express ions system mit 
zwei Vektoren. 
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Experiment el ler Teil : 
Kultivierung von Mikroorganismen 

Die Kultivierung der E. coli Zellen und deren Aufbewahrung 
5 erfolgte nach Sambrock et al . (Sambrook, J.; Fritsch, E. F. 
und Maniatis, T. (1989), Molecular cloning: a laboratory 
manual, 2 nd ed. , Cold Spring Harbor Laboratory Press, New 
York) . 

Zur Kultivierung der Rhodococcen wurde ein 

10 Chelatmineralmedium (CMM) nach Heald et al . 2001, (Heald S. 
C, P. F . B. Brandao, R. Hardicre and A . T . Bull, 2001: 
Physiology, biochemistry and taxonomy of deep-sea nitrile 
metabolising Rhodococcus strains. Antonie van Leeuwenhoek 
80, 169-183) eingesetzt. Das CM-Medium wird mit 5 g/1 

15 Glucose supplementiert . Fur Stamme mit cobaltabhangigen 
Enzymen wird 2,4 mg/1 CoCl 2 * 6 H 2 0, fur Stamme mit 
eisenabhangigen Enzymen 50 mg/1 FeSCU* 7 H 2 0 eingesetzt. 

Die aus der Kultur entnommene Probe wurden mit entsprechend 
der Kultivierung eingesetztem Kaliumphosphat puffer (6 ml/1 
20 einer 200 g/1 K 2 HP0 4 -L6sung und 4 ml/1 einer 157,5 g/1 

KH 2 P0 4 -Losung) so verdiinnt, dass der MeiSbereich zwischen 
0,05 und 0,3 lag. Als Referenz diente der Puffer. Gemessen 
wurde bei 600 nm. 

PCR 

25 Zur Amplif ikation von DNA-Fragmenten aus Rhodococcen wurden 
pro 50 y.1 Ansatz folgende Komponenten zusammenpipettiert : 

100 ng Chromosomal e DNA 
1 ]xl dNTP -Mix (alle 10 mM) 
5 ]il Puffer 
3 0 2 tjI DMSO 

0,5 \il Herculase (2,5 U) 
ad 50 ul H 2 0 
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Der Thermo cycler wurde fol gender ma£ en programmiert: 

A. 3 min 98 °C 

B. 40 sec 98°C 

C. 40 sec X°C 
5 D. Y min 72 °C 

i 

E. 5 min 72 °C 
P. 4°C 

Die Schritte B, C, D wurden 3 0 mal wiederholt. Die 
Anneal ingtemperatur X (C) errechnet sich aus der 
10 Schmelz temper a tur der verwendeten Primer und die 

Inkubationsdauer Y (D) aus der Lange des zu amplif izierenden 
Genes (1 kb DNA gleich 1 Minute-Regel) . 



■ Verdau mit Restriktionsenzymen 

15 Die zu schneidende DNA wird mit 5 U Restriktionsenzym und 
den zugehorigen Puffer vers eh en und wenn nicht anders 
erforderlich bei 37 °C inkubiert. Der Verdau chromosomaler 
DNA erfolgt mit 10 U Enzym. Die Inkubationsdauer betragt 1,5 
- 2 , 5 S tunden . 



Behandlung mit alkalischer Phosphatase 

Urn zu verhindern, dass Vektoren, welche nur mit einer 
Restriktionsendonuklease geschnitten wurden, mit sich selbst 
religieren, wird mit Hilfe der alkalischen Phosphatase der 
25 am 5'-Ende uberhangende Phosphatrest entfernt. Nur durch 
Insertion eines DNA-Fragments kann wieder zirkulare DNA 
entstehen. 

Der mit einer Restriktionsendonuklease geschnittene Vektor 
wird 15 min bei 65 °C inkubiert, -urn die 
3 0 Restriktionsendonuklease abzustoppen. AnschlieEend wird der 
Dephosphorylierungspuf f er zugegeben und mit 1 U alkalischer 
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Phosphatase aus Schrimps wird 10 min bei 3 7°C inkubiert. Das 
Enzym wird durch eine anschlieSende Gelelektrophorese von 
der Vektor-DNA abgetrennt. 



5 Behandlung mit T4-DNA-Ligase 

Fur die Ligation werden Vektor und Insert im Verhaltnis 1:3 
eingesetzt. Das Volumen wird moglichst gering gewahlt (7-2 0 
y.1) Der Ansatz wird in Ligationspuf f er und in Anwes enhei t 
von 1 U Ligase bei 16 °C uber Nacht inkubiert. 

10 Transformation 

Zum Ligations ansatz werden 100 y.1 kompetente Zellen 
pipettiert und der Ansatz durch wiederholtes Auf ziehen der 
Pipette gemischt. Nach 3 0 min Inkubation auf Eis wird ein 
Hi t z es chocks chr i 1 1 bei 42 °C fur 45 sec durchgef iihrt und 
15 wieder 2 min auf Eis inkubiert. Es werden 120-900 p.1 SOC- 
Medium zugegeben und der Ansatz wird 45 min bei 37 °C unter 
Agitation inkubiert. AnschlieSend wird der Ansatz 
ausplattiert und bei 37°C uber Nacht inkubiert. 



2 0 Expression der verschiedenen Nitrilhydratasen (Tabelle 1) im 

Ein-Vektor-Express ions system 

Folgendes Protokoll wurde zur Expression verwendet : 50 ml 
LB^pi oo -Medium mit 2 mM Fe-Citrat wurde l%ig mit einer 
Ubernachtkultur angeimpft. Nach Erreichen einer OD 6 oo von ca. 
25 0,5 wurde mit 1 mM IPTG (Isopropylthiogalactosid) die 

Expression der Nitrilhydratasen in den verschiedenen E. 
colls induziert. Die Ernte der Zellen erfolgte ca. 24 
Stunden nach Induktion. Die Expression der Nitrilhydratasen 
in Stamm DH5oc erfolgte konstitutiv, da dieser Stamm den 

■ 

3 0 lac-Repressor nicht- uberexprimiert . Dadurch entfallt hier 

der Induktionsschritt mit IPTG. 



040065 AM 



27 

Aktivitatsnachweis mit Benzonitril als Substrat: 

Die Biotransformation wurde im 10 ml MaSstab durchgefiihrt 

mit ca. 100 mg Biof euchtmasse (OD 60 o = 5) im 

Kaliumphosphatpuf f er (100 mM) pH7 , 0 . Die Inkubation erfolgte 
5 bei 3 0 °C und die Subs tratkonzentrat ion betrug ca. 5 mM 

Benzonitril. Die Probennahme erfolgte alle 5-10 min uber 
einen Zeitraum von maximal 1 Stunde. Das Probenvo lumen 
betrug 100 jll und die Reaktion wurde durch Zugabe von 10 |LLl 
50%ige Phosphorsaure gestoppt. 

10 Die Konzentrationen von Benzonitril und Benzamid wurden dann 
mittels HPLC bestimmt: 

Saule: RP18-Saule Phenomenex Hypersil ODS 5ja (mit Vorsaule) 
FlieSmittel: 10 mM K2HP04, (pH 2.3) 
FluSrate: 1 ml / min 
15 Wellenlange: 2 02 nm 

► 

Injektionsvolumen: 2 0 pi 
Dauer HPLC Lauf : 12-15 min 

i 

Die Berechnung der Aktivitat erfolgte liber die Kalkulation 
von einem (imol Umsatz nach einer Minute, was einem U (Unit 

2 0 entspricht) . Spezifische Aktivitaten werden in U pro g BTM 

oder mg Protein angegeben. 

Expression der Nitrilhydratase aus R . erythropolis 87 0-AN019 
im Zwei-Vektor-Express ions system 

Die Expression der Konstrukte mit T7-Promotoren erfolgte 
25 nach folgendem Protokoll: 

50 ml LBajnpioo-Medium mit 2 mM Fe-Citrat und jeweils 50 |Llg/ml 
Kanamycin & Ampicillin wurde l%ig mit einer Ubernachtkultur 
angeimpft. Nach Erreichen einer OD 60 o von ca. 0,5 wurde mit 1 
mM IPTG (Isopropylthiogalactosid) die Expression der 

3 0 Nitrilhydratasen induziert. Die Ernte der Zellen erfolgte 

ca. 24 Stunden nach Induktion bei 2 6°C. 

Expression der Nitrilhydratase aus R. rhodochrous M8 im 
Z we i-Vektor- Exp ressionssystem 
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Die Expression der Konstrukte mit T7- Promo tor en erfolgte 
nach folgendem Protokoll: 

50 ml LBampioo-Medium mit 0,5 niM CoCl 2 und jeweils 50 |Llg/ml 
Kanamycin & ' Ampicillin wurde l%ig mit einer Ubernachtkul tur 1 
5 angeimpft. Nach Erreichen einer OD 6 oo von ca. 0,5 wurde mit 1 
mM IPTG (Isopropylthiogalactosid) die 

Expression der NHasen induziert. Das Medium wurde zusatzlich 
mit 3% (w/v) Ethanol versetzt. Die Ernte der Zellen erfolgte 
ca, 24 Stunden nach Induktion bei 2 6 °C . 

10 Aktivitatsbestimmung 

Die Biotransformation zur Aktivitatsbestimmung mit den 
rekombinanten Nitrilhydratasen R. rhodochrous M8 und R . 
erythropolis 87 0-AN019 in E. coli erfolgte in kleinem 
MaEstab. Die Biotransformation wird in einem 1,5 ml 
15 Eppendorfcup bei 20°C durchgef uhrt . Im 

Biotransf ormationsansatz wurde eine OD von 0,4 eingesetzt. 
500 y.1 einer 4 % Acrylnitril-Losung ih 10 mM 

Kaliumphosphatpuf f er, pH 7 , 5 sowie der Puffer werden bei 20 
°C vorinkubiert . Die Reaktion wird durch Zugabe der Zellen 

20 gestartet. Dabei betragt die Surrane des Puffer- und 

Zellvolumens 500 p.1 . Sofort nach Mischung des Ansatzes 
werden 100 y.1 entnommen und zu 1,5 p.1 vorgelegter 
konzentrierter HCl pipettiert. Nach Mischung wird die Probe 
2 min bei 13 000 rpm in der Eppendorf -Zentrif uge 

25 abzentrifugiert und 70 ]il des Uberstands zur Analyse mittels 
HPLC aufbewahrt bei - 20°C. Die Probennahme erfolgte alle 5 
- 10 min uber einen Zeitraum von maximal 2 Stunden. 
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Analyse von Acrylnitril, Acrylamid und Acrylsaure 

Mit der nachf olgend beschriebenen HPLC Methode ist es 
moglich Acrylnitril, Acrylamid und Acrylsaure in kurzer Zeit 
zu analysieren und die Konzentartion dieser Substanzen zu 
5 bestiinmen: 

Saule: Synergi 4p. Hydro-RP mit Vorsaule 
Fliefimittel: 0,1 % H 3 P0 4 in 10 % Acetonitril, 90 % H 2 0 
FluSrate: 0,5 ml / min 
Wellenlange: 202 nm 
10 Injektionsvolumen: 5 ]il 

Dauer HPLC Lauf : 10 min, letzter Peak nach 5,5 min 

Die Berechnung der Aktivitat erfolgte fiber die Kalkulation 
von einem (imol Umsatz nach einer Minute, was einem U (Unit 
entspricht) . Spezifische Aktivitaten we r den in U pro g BTM 
15 oder mg Protein angegeben. 
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Patentanspriiche : 



10 



15 



20 




25 



Expressionssystem fur die gleichzeitige Expression der 
Nukl eins aur es equenzen kodierend fur die verschiedenen 
Untereinheiten einer Nitrilhydratase, 
dadurch gekennzeichnet, dass 

das Expressionssystem mindestens je ein Plasmid mit 
mindestens einer Nukl eins aur esequenz kodierend fur die 
jeweilige Untereinheit aufweist. 

Expressionssystem nach Anspruch 1, 

dadurch gekennzeichnet, dass 

dieses in E. coli als Wirt vorliegt. 

Expressionssystem nach einem oder mehreren der 
vorhergehenden Anspriiche, 
dadurch gekennzeichnet, dass 

die Expression der Nukleinsauresequenzen kodierend fur 
die Untereinheiten unter der Kontrolle von jeweils dem 
gleichen Promotor steht. 

Expressionssystem nach Anspruch 3, 

dadurch gekennzeichnet, dass 

der Promotor ein T7-Promotor ist. 

Expressionssystem nach einem oder mehreren der 
vorhergehenden Anspriiche, 
dadurch gekennzeichnet, dass 

pro eingesetztem Plasmidsatz mindestens eine 
Nukleinsauresequenz kodierend fur das p47K- oder pl2K- 
Protein vorhanden ist. 



6 
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Expressionssystem nach einem oder mehreren der 
vorhergehenden Anspriiche , 
dadurch gekennzeichnet, dass 

die Nukleinsauresequenzen kodierend fur die 
Untereinheiten der Nitrilhydratasen aus Rhodococcus- 
Stammen stammen. 
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7. Express ions system nach einem oder mehreren der 
vorhergehenden Anspriiche , 

dadurch gekennzeichnet , dass 

man die Nukl eins aur es equenz en kodierend fur die 
5 Untereinheiten der Nitrilhydratasen entsprechend der 

„codon usage" von E. coli modifiziert einsetzt. 

8. Expressionssystem nach einem oder mehreren der 
vorhergehenden Anspriiche, 

dadurch gekennzeichnet, dass 
10 man als Plasmide solche der pET-Reihe benutzt. 

9. Verfahren zur Herstellung von Nitrilhydratasen unter 
Verwendung eines Express ions systems gemaS einem oder 
mehreren der Anspriiche 1 bis 8 • 

10. Wirtsorganismus aufweisend ein Expressionssystem gemaiS . 
15 einem oder mehreren der Anspriiche 1 bis 8 . 

11. Verfahren zur Herstellung von, ggf . 
enantiomerenangereicherten, (Amino- ) Carbons aur en oder 
(Amino-) Carbonsaureaureamiden unter Verwendung eines 
Wirtsorganismus gemaS einem oder mehreren der Anspriiche 

20 1 bis 8 . 
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Zusammenfassung : 

Die vorliegende Erfindung bezieht sich auf ein neues 
Express ions system fur Nitrilhydratase . Die aus 
Untereinheiten aufgetaauten Nitrilhydratasen werden dabei 
der Art und Weise gebildet, dass die jeweilige 
Untereinheiten auf unterschiedlichen Plasmiden beheimatet 
sind und gleichzeitig in E. coll exprimiert werden. 
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Abb. 1 




i BamHI 
Hindlll 



040065 AM 



34 
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Abb. 3 
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Abb. 4 
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Abb . 5 
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SEQUENCE LISTING 
<110> Degussa AG 

5 <12 0> Expression von Nitrilhydratasen im Zwei-Vekt or- Express ions system 
<130> 040065 AM 
<160> 34 

<170> Patentln version 3.1 



<210> 1 

<211> 624 

15 <212> DNA 

<213> Rhodococcus erythropolis 

<220> 

<221> CDS 
20 <222> (1) . . (624) 
<223> 

<400> 1 

atg tea gta acg ate gac cac aca acg gag aac gec gca ccg gec cag 48 

2 5 Met Ser Val Thr lie Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
15 10 15 



gcg ccg gtc tec gat cgc 

Ala Pro Val Ser Asp Arg 

30 20 

aag gga ttg gta ccc gac 

Lys Gly Leu Val Pro Asp 
35 

35 

gag gag gac ttc agt cca 

Glu Glu Asp Phe Ser Pro 
50 



gcg tgg gec ctg ttc cgc 
Ala Trp Ala Leu Phe Arg 
25 

ggt tac gtc gag gga tgg 
Gly Tyr Val Glu Gly Trp 
40 

agg cgc gga gcg gaa ttg 
Arg Arg Gly Ala Glu Leu 
55 60 



gca etc gac ggt 9 6 

Ala Leu Asp Gly 
30 

aag aag acc ttc 144 

Lys Lys Thr Phe 

45 

gtc gcg egg gcg 192 
Val Ala Arg Ala 



40 tgg acc gac ccc gat ttc egg caa 
Trp Thr Asp Pro Asp Phe Arg Gin 
65 70 

gcg gtt gee cag tac gga tat ctg 
45 Ala Val Ala Gin Tyr Gly Tyr Leu 

85 



ctg ctt etc acc gac ggt acc gee 240 
Leu Leu Leu Thr Asp Gly Thr Ala 
75 80 

ggc ccc cag ggc gaa tac ate gtg 2 88 

Gly Pro Gin Gly Glu Tyr He Val 
90 95 



gca gtc gaa gac acc ccg 
Ala Val Glu Asp Thr Pro 
50 100 

tgt tea tgc acc gcg tgg 
Cys Ser Cys Thr Ala Trp 
115 

55 

aag agt ttc gaa tac cgt 
Lys Ser Phe Glu Tyr Arg 
130 



acc etc aag aac gtg ate 
Thr Leu Lys Asn Val He 
105 

ccc att etc ggc ctg ccc 
Pro He Leu Gly Leu Pro 
120 

gcg cga gtg gtg cgt gag 
Ala Arg Val Val Arg Glu 
135 140 



gtg tgc teg ctg 33 6 

Val Cys Ser Leu 
110 

cct acc tgg tac 3 84 

Pro Thr Trp Tyr 

125 

cca egg aag gtt 432 
Pro Arg Lys Val 
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etc ttc gag atg gga acc gag ate gcg teg gac gtc gag ate cgc gtc 480 
Leu Phe Glu Met Gly Thr Glu lie Ala Ser Asp Val Glu lie Arg Val 
145 150 155 160 

5 tac gac acc acc gee gaa act cgc tac atg gtt etc ccg caa cgt ccc 52 8 

Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 

165 170 175 

gca ggc acc gaa ggc tgg age cag gaa cag ctt cag gag ate gtc acc 57 6 

10 Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu lie Val Thr 

180 185 190 

aag gac tgc ctg ate ggc gtc gca gtc ccg cag gtc ccc acc gtc tga 624 
Lys Asp Cys Leu lie Gly Val Ala Val Pro Gin Val Pro Thr Val 
15 195 200 205 

<210> 2 

<211> 207 

2 0 <212> PRT 

<213> Rhodococcus erythropolis 

<400> 2 

2 5 Met Ser Val Thr He Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
15 10 15 

■ 

Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly 
30 20 25 30 



35 



40 



Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe 
35 40 45 



Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala 
50 55 60 



Trp Thr Asp Pro Asp Phe Arg Gin Leu Leu Leu Thr Asp Gly Thr Ala 
65 70 75 80 



45 Ala Val Ala Gin Tyr Gly Tyr Leu Gly Pro Gin Gly Glu Tyr He Val 

85 90 95 



Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val He Val Cys Ser Leu 
50 100 105 110 

Cys Ser Cys Thr Ala Trp Pro He Leu Gly Leu Pro Pro Thr Trp Tyr 
115 120 125 

55 



Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val 
130 135 140 
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Leu Phe Glu Met Gly Thr Glu He Ala Ser Asp Val Glu He Arg Val 
145 150 155 160 



Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 

165 170 175 



10 Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu lie Val Thr 

180 185 190 

Lys Asp Cys Leu He Gly Val Ala Val Pro Gin Val Pro Thr Val 
15 195 200 205 

<210> 3 
<211> 639 

2 0 <212> DNA 

<213> Rhodococcus erythropolis 

<220> 

<221> CDS 
25 <222> (1) . . (639) 
<223> 

<400> 3 

atg gat gga gta cac gat ctt gcc gga gtt caa ggc ttc ggc aaa gtc 48 

3 0 Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 

15 10 15 

ccg cat acc gtc aac gcc gac ate ggc ccc acc ttc cac gcc gag tgg 9 6 

Pro His Thr Val Asn Ala Asp He Gly Pro Thr Phe His Ala Glu Trp 
35 20 25 30 

gaa cac ctg ccg tac age ctg atg ttc gcc ggt gtc gcc gaa etc ggg 144 

Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
35 40 45 

40 

gca ttc age gtc gac gaa gtt cga tac gtc gtc gag egg atg gaa cca 192 

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 
50 55 60 

45 cgc cac tac atg atg acc ccg tac tac gag agg tac gtc ate ggc gtc 240 
Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val He Gly Val 
65 70 75 80 

gcg aca ctg atg gtc gaa aag gga ate ctg acg cag gaa gaa etc gaa 288 
50 Ala Thr Leu Met Val Glu Lys Gly He Leu Thr Gin Glu Glu Leu Glu 

85 90 95 

age ctt gca ggg gga ccg ttc cca ctg teg egg ccc age gaa tec gaa 33 6 

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 
55 100 105 110 

ggg egg ccg gca ccc gtc gag acg acc acc ttc gaa ate ggt cag cga 384 
Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu He Gly Gin Arg 
115 120 125 
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gta cgc gtg cgc gac gag tac gtt ccg ggg cat att cga atg cct gcg 432 
Val Arg Val Arg Asp Glu Tyr Val Pro Gly His He Arg Met Pro 111 
130 135 140 

tac tgc cgc gga cga gtg gga acc ate tct cat egg act acc aacr aao- Asn 
Tyr Cys Arg Gly Arg Val Gly Thr He Ser His Arg Thr Sr £S lys 
i4b ISO 155 leo 

tgg ccg ttt ccc gac gca ate ggc cac ggg cgc aac gac gec ggc gaa 528 
Trp Pro Phe Pro Asp Ala He Gly His Gly Arg Asn Asp Ala Gly gIu 

165 170 175 

1 R ri^ „ aC gtg aag ttc gac gcc 3ag gaa ttg ttc ggt age 576 

15 Glu Pro Thr Tyr His Val Lys Phe Asp Ala Glu Glu Leu Phe Gly Ser 



10 



25 



40 



45 



50 



180 i 8 5 



190 



gac acc gac ggc ggc age gtc gta gtc gac ctt ttc gag ggt tac etc 
Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 



200 205 



gag cct gcg gec tga 
Glu Pro Ala Ala 
210 



<210> 4 

<211> 212 

<212> PRT 

3 0 <213> Rhodococcus erythropolis 

<400> 4 



Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 
Jb 1 5 10 m 



Pro His Thr Val Asn Ala Asp lie Gly Pro Thr Phe His Ala Glu Trp 

20 25 so 

Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
3 5 40 45 

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 
50 55 60 

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val lie Gly Val 
65 70 75 80 



624 



639 



Ala Thr Leu Met Val Glu Lys Gly lie Leu Thr Gin Glu Glu Leu Glu 
55 85 90 95 

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 

100 105 HO 
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5 



10 



25 



30 



35 



40 



45 



Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu He Gly Gin Afg 
115 120 125 



Val Arg Val Arg Asp Glu Tyr Val Pro Gly His He Arg Met Pro Ala 
130 135 140 



Tyr Cys Arg Gly Arg Val Gly Thr He Ser His Arg Thr Thr Glu Lys 
145 150 155 160 



15 Trp Pro Phe Pro Asp Ala He Gly His Gly Arg Asn Asp Ala Gly Glu 

165 170 175 

Glu Pro Thr Tyr His Val Lys Phe Asp Ala Glu Glu Leu Phe Gly Ser 
20 180 185 190 



Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 
195 > 200 205 

Glu Pro Ala Ala 
210 

<210> 5 

<211> 624 

<212> DNA 

<213> Rhodococcus erythropolis 

<220> 
<221> CDS 
<222> (1) . . (624) 
<223> 

<400> 5 

atg tea gta acg ate gac cac aca acg gag aac gec gca ccg gec cag 48 

Met Ser Val Thr He Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
1-5 10 15 

gcg ccg gtc tec gat cgc gcg tgg gec ctg ttc cgc gca etc gac ggt 96 
Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly 

20 25 30 

50 aag gga ttg gta ccc gac ggt tac gtc gaa gga tgg aag aaa acc ttc 144 
Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe 
35 40 45 

gag gag gac ttc agt cca agg cgc gga gcg gaa ttg gtc gcg egg gcg 192 
55 Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala 

50 55 60 
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tgg acc gac ccc gag ttc egg cag ttg ctt etc acc gac ggt acc gec 240 
Trp Thr Asp Pro Glu Phe Arg Gin Leu Leu Leu Thr Asp Gly Thr Ala 
65 70 75 80 

5 gcg gtt gec cag tac gga tac ctg ggc ccc cag ggc gag tac ate gtg 2 88 

Ala Val Ala Gin Tyr Gly Tyr Leu Gly Pro Gin Gly Glu Tyr lie Val 

85 90 95 

gca gtc gaa gac acc ccg acc etc aag aac gtg ate gtg tgc teg ctg 33 6 

10 Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val lie Val Cys Ser Leu 

100 105 110 

tgt tea tgc acc gcg tgg ccc att etc ggc ctg ccc cct acc tgg tac 3 84 

Cys Ser Cys Thr Ala Trp Pro lie Leu Gly Leu Pro Pro Thr Trp Tyr 
15 115 120 125 

aag agt ttc gaa tac cgt gcg cga gtg gtg cgt gag cca egg aag gtt '432 
Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val 
130 135 140 

20 

etc tec gag atg gga acc gag ate gcg teg gac gtc gag ate cgc gtc 480 
Leu Ser Glu Met Gly Thr Glu lie Ala Ser Asp Val Glu lie Arg Val 
145 150 155 " 160 

2 5 tac gac acc acc gee gaa act cgc tac atg gtt etc ccg caa cgt ccc 52 8 

Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 

165 170 175 

gca ggc acc gaa ggc tgg age cag gaa caa ctg cag gaa ate gtc acc 576 

3 0 Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu lie Val Thr 

180 185 190 

aag gac tgc ctg ate ggc gtc gca gtc ccg cag gtc ccc acc gtc tga 624 
Lys Asp Cys Leu lie Gly Val Ala Val Pro Gin Val Pro Thr Val 
35 195 200 205 



<210> 6 

<211> 207 

4 0 <212> PRT 

<213> Rhodococcus erythropolis 

<400> 6 

45 Met Ser Val Thr lie Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
15 10 15 



Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly 
50 20 25 30 



Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe 
3 5 40 45 



55 



Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala 
50 55 60 
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20 



25 



Trp Thr Asp Pro Glu Phe Arg Gin Leu Leu Leu Thr Asp Gly Thr Ala 
65 70 75 " 80 



Ala Val Ala Gin Tyr Gly Tyr Leu Gly Pro Gin Gly Glu Tyr He Val 

85 90 95 



10 Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val He Val Cys Ser Leu 

100 105 110 



Cys Ser Cys Thr Ala Trp Pro He Leu Gly Leu Pro Pro Thr Trp Tyr 
15 115 12 0 125 



Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val 
130 135 140 



Leu Ser Glu Met Gly Thr Glu He Ala Ser Asp Val Glu He Arg Val 
145 150 155 160 



Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 

165 170 175 



3 0 Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu He Val Thr 

180 185 190 

Lys Asp Cys Leu He Gly Val Ala Val Pro Gin Val Pro Thr Val 
35 195 200 205 

<210> 7 

<211> 639 

40 <212> DNA 

<213> Rhodococcus erythropolis 

<220> 

<221> CDS 
45 <222> (1) . . (639) 
<223> 

<400> 7 

atg gat gga gta cac gat ctt gcc gga gtt caa ggc ttc ggc aaa gtc 48 
5 0 Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 
15 10 15 

ccg cat acc gtc aac gcc gac ate ggc ccc acc ttc cac gcc gag tgg 96 
Pro His Thr Val Asn Ala Asp He Gly Pro Thr Phe His Ala Glu Trp 
55 20 25 30 

gaa cac ctg ccg tac age ctg atg ttc gcc ggt gtc gcc gaa etc ggg 144 
Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
35 40 45 



040065 AM 



8 



gca ttc age gtc gac gaa gtt cga tac gtc gtc gag egg atg gaa cca 192 

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 

50 55 60 

5 

cgc cac tac atg atg acc ccg tac tac gag agg tac gtc ate ggc gtc 240 

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val lie Gly Val 
65 70 75 80 

10 gcg aca ctg atg gtc gaa aag gga ate ctg acg cag gat gaa etc gaa 2 88 

Ala Thr Leu Met Val Glu Lys Gly lie Leu Thr Gin Asp Glu Leu Glu 

85 90 95 

age ctt gca ggg gga ccg ttc cca ctg teg egg ccc age gaa tec gaa 33 6 

15 Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 

100 105 110 

ggg cgt ccg gca ccc gtc gag acg acc acc ttc gaa ate ggt cag cga 3 84 

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu He Gly Gin Arg 
20 115 120 125 

gta cgc gtg cgc gac gag tac gtt ccg ggg cat att cga atg cct gcg 432 

Val Arg Val Arg Asp Glu Tyr Val Pro Gly His He Arg Met Pro Ala 

130 135 140 

25 

tac tgc cgc gga cga gtg gga acc ate tct cat egg act acc gag aag 480 

Tyr Cys Arg Gly Arg Val Gly Thr He Ser His Arg Thr Thr Glu Lys 

145 150 155 160 

3 0 tgg cca ttt ccc gac gca ate ggc cac ggg cgc aac gac gee ggc gaa 52 8 

Trp Pro Phe Pro Asp Ala He Gly His Gly Arg Asn Asp Ala Gly Glu 

165 170 175 

gaa ccg acg tac cac gtg aag ttc gee gee gag gaa ttg ttc ggt age 57 6 

3 5 Glu Pro Thr Tyr His Val Lys Phe Ala Ala Glu Glu Leu Phe Gly Ser 

180 185 190 

gac acc gac ggc ggc age gtc gta gtc gac ctt ttc gag ggt tac etc 624 
Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 
40 195 200 205 

gag cct gcg gee tga 639 
Glu Pro Ala Ala 
210 

45 

<210> 8 
<211> 212 
<212> PRT 
50 <213> Rhodococcus erythropolis 

<400> 8 

Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 
55 1 5 10 15 



Pro His Thr Val Asn Ala Asp He Gly Pro Thr Phe His Ala Glu Trp 

20 25 30 
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Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
35 40 45 

5 

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 
50 55 60 

10 

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val lie Gly Val 
65~ 70 1 75 80 



15 Ala Thr Leu Met Val Glu Lys Gly lie Leu Thr Gin Asp Glu Leu Glu 

85 90 95 



Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 
20 100 105 110 

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu lie Gly Gin Arg 
115 120 125 

25 

Val Arg Val Arg Asp Glu Tyr Val Pro Gly His lie Arg Met Pro Ala 
130 135 140 

30 

Tyr Cys Arg Gly Arg Val Gly Thr lie Ser His Arg Thr Thr Glu Lys 
145 150 155 160 

3 5 Trp Pro Phe Pro Asp Ala lie Gly His Gly Arg Asn Asp Ala Gly Glu 

165 170 175 



Glu Pro Thr Tyr His Val Lys Phe Ala Ala Glu Glu Leu Phe Gly Ser 
40 180 185 190 

Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 
195 200 205 

45 

Glu Pro Ala Ala 
210 

50 

<210> 9 
<211> 624 
<212> DNA 

<213> Rhodococcus erythropolis 

55 

<220> 

<221> CDS 

<222> (1) . . (624) 

<223> 
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10 



10 





50 



55 



<400> 9 

atg tea gta acg ate gac cac aca acg gag aac gec gca ccg gec cag 
Met Ser Val Thr He Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
15 10 15 

gcg ccg gtc tec gac egg gcg tgg gec ctg ttc cgc gca etc gac ggt 
Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly 

20 25 30 



tac gac ace ace gee gaa act cgc tac atg gtt etc ccg caa cgt ccc 
Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 
45 " 165 170 175 



aag gac tgc ctg ate ggc gtc gca gtc ccg cag gtc ccc ace gtc tga 
Lys Asp Cys Leu He Gly Val Ala Val Pro Gin Val Pro Thr Val 
195 200 205 



<210> 10 

<211> 207 

<212> PRT 

<213> Rhodococcus erythropolis 



48 



96 



aag gga ttg gta ccc gac ggt tac gtc gag gga tgg aag aag ace ttc 144 
Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe 
35 40 45 



15 gag gag gac ttc agt cca agg cgc gga gcg gaa ttg gtc gcg egg gcg 192 
Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala 
50 55 60 

tgg ace gac ccc gag ttc egg cag ttg ctt etc acc gac ggt ace gee 240 

2 0 Trp Thr Asp Pro Glu Phe Arg Gin Leu Leu Leu Thr Asp Gly Thr Ala 

65 70 75 80 

gcg gtt gee cag tac gga tat ctg ggc ccc cag ggc gag tac ate gtg 2 88 

Ala Val Ala Gin Tyr Gly Tyr Leu Gly Pro Gin Gly Glu Tyr He Val 
25 85 90 95 

gca gtc gaa gac acc ccg acc etc aag aac gtg ate gtg tgc teg ttg 33 6 

Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val He Val Cys Ser Leu 

100 105 110 

30 

tgt tea tgc acc gcg tgg ccc att etc ggc ctg ccc cct acc tgg tac 

Cys Ser Cys Thr Ala Trp Pro He Leu Gly Leu Pro Pro Thr Trp Tyr 
115 120 125 

3 5 aag agt ttc gaa tac cgt gcg cga gtg gtg cgt gag cca egg aag gtt 

Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val 
130 135 140 



384 



432 



etc tec gag atg gga acc gag ate gcg teg gac gtc gag ate cgc gtc 480 
Leu Ser Glu Met Gly Thr Glu He Ala Ser Asp Val Glu He Arg Val 
145 150 155 160 



528 



gca ggc acc gaa ggc tgg age cag gaa cag ctt caa gag ate gtc acc 576 
Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu He Val Thr 

180 185 190 



624 
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11 



<400> 10 

Met Ser Val Thr He Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gin 
5 1 5 10 15 

Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly 

20 25 30 

10 

Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe 
35 40 45 

15 

Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala 
50 . 55 60 

2 0 Trp Thr Asp Pro Glu Phe 'Arg Gin Leu Leu Leu Thr Asp Gly Thr Ala 
' 65 70 75 80 

Ala Val Ala Gin Tyr Gly Tyr Leu Gly Pro Gin Gly Glu Tyr He Val 
25 85 90 95 

Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val He Val Cys Ser Leu 

100 105 110 

30 

Cys Ser Cys Thr Ala Trp Pro He Leu Gly Leu Pro Pro Thr Trp Tyr 
115 120 125 

35* 

Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val 
130 135 140 

40 Leu Ser Glu Met Gly Thr Glu He Ala Ser Asp Val Glu He Arg Val 
145 150 155 160 

Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gin Arg Pro 
45 ~ 165 170 175 



Ala Gly Thr Glu Gly Trp Ser Gin Glu Gin Leu Gin Glu He Val Thr 

180 185 190 

50 

Lys Asp Cys Leu He Gly Val Ala Val Pro Gin Val Pro Thr Val 
195 200 205 

55 

<210> 11 
<211> 639 
<212> DNA 

<213> Rhodococcus erythropolis 
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12 



<220> 

<221> CDS 
<222> (1) . . (639) 
5 <223> 

<400> 11 

atg gat gga gta cac gat ctt gcc gga gtt caa ggc ttc ggc aaa gtc 48 

Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 

10 1 5 10 15 

ccg cat acc gtc aac gcc gac ate ggc ccc acc ttc cac gcc gag tgg 96 
Pro His Thr Val Asn Ala Asp lie Gly Pro Thr Phe His Ala Glu Trp 

20 25 30 



15 



55 



gaa cac ctg ccg tac age ctg atg ttc gcc ggt gtc gcc gaa etc ggg 144 
Glu His lieu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
35 40 45 



2 0 gca ttc age gtc gac gaa gtt cga tac gtc gtc gag egg atg gaa cca 192 

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 

50 55 60 

cgc cac tac atg atg acc ccg tac tac gag agg tac gtc ate ggc gtc 240 

25 Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val lie Gly Val 
65 70 75 80 

gcg aca ctg atg gtc gaa aag gga ate ctg acg cag gaa gaa etc gaa 2 88 

Ala Thr Leu Met Val Glu Lys Gly lie Leu Thr Gin Glu Glu Leu Glu 
30 85 90 95 

age ctt gca ggg gga ccg ttc cca ctg teg egg cca age gaa tec gaa 33 6 

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 

100 105 110 

35 

ggg cgt ccg gca ccc gtc gag acg acc acc ttc gaa gtc ggt cag cga 3 84 

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu Val Gly Gin Arg 

115 120 125 

40 gta cgc gtg cgc gac gag tac gtt ccg ggg cat att cga atg cct gcg 432 

Val Arg Val Arg Asp Glu Tyr Val Pro Gly His lie Arg Met Pro Ala 

130 135 140 

tac tgc cgc gga cga gtg gga acc ate tct cat egg act acc gag aag 480 

45 Tyr Cys Arg Gly Arg Val Gly Thr lie Ser His Arg Thr Thr Glu Lys 
145 ^ 150 155 160 



tgg cca ttt ccc gac gca ate ggc cac ggg cgc aac gac gcc ggc gaa 
Trp Pro Phe Pro Asp Ala lie Gly His Gly Arg Asn Asp Ala Gly Glu 
50 165 170 175 



gac acc gac ggc ggc age gtc gta gtc gac ctt ttc gag ggt tac etc 
Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 
195 200 205 



528 



gaa ccg acg tac cac gtg aag ttc gac gcc gag gaa ttg ttc ggt age 57 £ 

Glu Pro Thr Tyr His Val Lys Phe Asp Ala Glu Glu Leu Phe Gly Ser 

180 185 190 



624 
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13 



gag cct gcg gcc tga 
Glu Pro Ala Ala 
210 

5 

<210> 12 
<211> 212 
<212> PRT 

<213> Rhodococcus erythropolis 

10 

<400> 12 

Met Asp Gly Val His Asp Leu Ala Gly Val Gin Gly Phe Gly Lys Val 
15 10 15 

15 

Pro His Thr Val Asn Ala Asp lie Gly Pro Thr Phe His Ala Glu Trp 

20 25 30 

20 

Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly 
35 40 45 

25 Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro 

50 55 60 

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val lie Gly Val 
30 65 70 75 80 

Ala Thr Leu Met Val Glu Lys Gly He Leu Thr Gin Glu Glu Leu Glu 

85 90 95 

35 

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu 

100 105 110 

40 

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu Val Gly Gin Arg 
115 120 125 

45 Val Arg Val Arg Asp Glu Tyr Val Pro Gly His He Arg Met Pro Ala 

130 135 140 

Tyr Cys Arg Gly Arg Val Gly Thr He Ser His Arg Thr Thr Glu Lys 
50 145 150 155 160 

Trp Pro Phe Pro Asp Ala He Gly His Gly Arg Asn Asp Ala Gly Glu 

165 170 175 

55 

Glu Pro Thr Tyr His Val Lys Phe Asp Ala Glu Glu Leu Phe Gly Ser 

180 185 190 



639 
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Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu 
195 200 205 

5 

Glu Pro Ala Ala 
210 



10 <210> 13 

<211> 612 

<212> DNA 

<213> Rhodococcus erythropolis 

15 <220> 

<221> CDS 

<222> (1) . . (612) 

<223> 

20 <400> 13 

gtg age gag cac gtc aat aag tac acg gag tac gag gca cgt acc aag 48 

Val Ser Glu His Val Asn Lys Tyr Thr Glu Tyr Glu Ala Arg Thr Lys 
15 10 15 

2 5 gca ate gaa act ttg ctg tac gag cga ggg etc ate acg ccc gee gcg 9 6 

Ala He Glu Thr Leu Leu Tyr Glu Arg Gly Leu He Thr Pro Ala Ala 

20 25 30 

gtc gac cga gtc gtt teg tac tac gag aac gag ate ggc ccg atg ggc 144 

3 0 Val Asp Arg Val Val Ser Tyr Tyr Glu Asn Glu He Gly Pro Met Gly 

35 40 45 

ggt gee aag gtc gtg gcg aag tec tgg gtg gac cct gag tac cgc aag 192 
Gly Ala Lys Val Val Ala Lys Ser Trp Val Asp Pro Glu Tyr Arg Lys 
3 5 50 55 60 



40 



tgg etc gaa gag gac gcg acg gee gcg atg gcg tea ttg ggc tat gee 
Trp Leu Glu Glu Asp Ala Thr Ala Ala Met Ala Ser Leu Gly Tyr Ala 
65 70 75 80 



240 



ggt gag cag gca cac caa att teg gcg gtc ttc aac gac tec caa acg 2 88 

Gly Glu Gin Ala His Gin He Ser Ala Val Phe Asn Asp Ser Gin Thr 

85 90 95 

45 cat cac gtg gtg gtg tgc act ctg tgt teg tgc tat ccg tgg ccg gtg 33 6 

His His Val Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val 

100 105 110 



ctt ggt etc ccg ccc gee tgg tac aag age atg gag tac egg tec cga 
50 Leu Gly Leu Pro Pro Ala Trp Tyr Lys Ser Met Glu Tyr Arg Ser Arg 

115 120 125 



384 



gtg gta gcg gac cct cgt gga gtg etc aag cgc gat ttc ggt ttc gac 432 
Val Val Ala Asp Pro Arg Gly Val Leu Lys Arg Asp Phe Gly Phe Asp 
55 130 135 140 

ate ccc gat gag gtg gag gtc agg gtt tgg gac age age tec gaa ate 480 
He Pro Asp Glu Val Glu Val Arg Val Trp Asp Ser Ser Ser Glu He 
145 150 155 160 
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15 



cgc tac ate gtc ate ccg gaa egg ccg gec ggc acc gac ggt tgg tec 52 8 

Arg Tyr He Val He Pro Glu Arg Pro Ala Gly Thr Asp Gly Trp Ser 

165 170 175 

5 

gag gac gag ctg gcg aag ctg gtg agt egg gac teg atg ate ggt gtc 576 

Glu Asp Glu Leu Ala Lys Leu Val Ser Arg Asp Ser Met He Gly Val 

180 185 190 

10 agt aat gcg etc aca ccc cag gaa gtg ate gta tga 612 
Ser Asn Ala Leu Thr Pro Gin Glu Val He Val 
195 200 

15 <210> 14 
<211> 203 
<212> PRT 

<213> Rhodo coccus erythropolis 
20 <400> 14 

Val Ser Glu His Val Asn Lys Tyr Thr Glu Tyr Glu Ala Arg Thr Lys 
15 10 15 



25 



40 



45 



Ala He Glu Thr Leu Leu Tyr Glu Arg Gly Leu He Thr Pro Ala Ala 

20 25 30 



3 0 Val Asp Arg Val Val Ser Tyr Tyr Glu Asn Glu He Gly Pro Met Gly 

35 40 45 



Gly Ala Lys Val Val Ala Lys Ser Trp Val Asp Pro Glu Tyr Arg Lys 
35 50 55 60 



Trp Leu Glu Glu Asp Ala Thr Ala Ala Met Ala Ser Leu Gly Tyr Ala 
65 70 75 80 



Gly Glu Gin Ala His Gin He Ser Ala Val Phe Asn Asp Ser Gin Thr 

85 90 95 



His His Val Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val 

100 105 110 



5 0 Leu Gly Leu Pro Pro Ala Trp Tyr Lys Ser Met Glu Tyr Arg Ser Arg 

115 120 125 



Val Val Ala Asp Pro Arg Gly Val Leu Lys Arg Asp Phe Gly Phe Asp 
55 130 135 140 



He Pro Asp Glu Val Glu Val Arg Val Trp Asp Ser Ser Ser Glu He 
145 150 155 160 
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16 



5 



10 



Arg Tyr lie Val lie Pro Glu Arg Pro Ala Gly Thr Asp Gly Trp Ser 

165 170 175 



Glu Asp Glu Leu Ala Lys Leu Val Ser Arg Asp Ser Met lie Gly Val 

180 185 190 



Ser Asn Ala Leu Thr Pro Gin Glu Val He Val 
195 200 



15 <210> 15 

<211> 690 

<212> DNA 

<213> Rhodococcus erythropolis 

20 <220> 

<221> CDS 

<222> (1) . . (690) 

<223> 

25 <400> 15 

atg gat ggt ate cac gac aca ggc ggc atg acc gga tac gga ccg gtc 48 

Met Asp Gly He His Asp Thr Gly Gly Met Thr Gly Tyr Gly Pro Val 
15 10 15 

3 0 ccc tat cag aag gac gag ccc ttc ttc cac tac gag tgg gag ggt egg 96 
Pro Tyr Gin Lys Asp Glu Pro Phe Phe His Tyr Glu Trp Glu Gly Arg 

20 25 30 

acc ctg teg att ctg acc tgg atg cat etc aag ggc atg teg tgg tgg 144 
35 Thr Leu Ser He Leu Thr Trp Met His Leu Lys Gly Met Ser Trp Trp ! 

35 40 45 

gac aag teg egg ttc ttc egg gag teg atg ggg aac gaa aac tac gtc 192 
Asp Lys Ser Arg Phe Phe Arg Glu Ser Met Gly Asn Glu Asn Tyr Val 
40 50 55 60 

aac gag att cgc aac teg tac tac acc cac tgg ctg agt gcg gca gaa 240 

Asn Glu He Arg Asn Ser Tyr Tyr Thr His Trp Leu Ser Ala Ala Glu 

65 70 75 80 

45 

cgt ate etc gtc gee gac aag ate ate acc gaa gaa gag cga aag cac 2 88 

Arg He Leu Val Ala Asp Lys He He Thr Glu Glu Glu Arg Lys His 

85 90 95 

50 cgt gtg cag gag ate etc gag ggt egg tac acg gac agg aac ccg teg 33 6 

Arg Val Gin Glu He Leu Glu Gly Arg Tyr Thr Asp Arg Asn Pro Ser 

100 105 110 

egg aag ttc gat ccg gee gag ate gag aag gcg ate gaa egg ctt cac 3 84 

55 Arg Lys Phe Asp Pro Ala Glu He Glu Lys Ala He Glu Arg Leu His 

115 120 125 
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gag ccc cac tec eta gca ctt cca gga gcg gag ccg agt ttc tec etc 432 

Glu Pro His Ser Leu Ala Leu Pro Gly Ala Glu Pro Ser Phe Ser Leu 
130 135 140 

5 ggt gac aag gtc aaa gtg aag aat atg aac ccg ctg gga cac aca egg 480 
Gly Asp Lys Val Lys Val Lys Asn Met Asn Pro Leu Gly His Thr Arg 
145 150 155 160 

tgc ccg aaa tat gtg egg aac aag ate ggg gaa ate gtc ace tec cac 52 8 

10 Cys Pro Lys Tyr Val Arg Asn Lys lie Gly Glu He Val Thr Ser His 

165 170 175 

ggc tgc cag ate tat ccc gag age age tec gee ggc etc ggc gac gat 576 
Gly Cys Gin He Tyr Pro Glu Ser Ser Ser Ala Gly Leu Gly Asp Asp 
15 180 185 190 

ccc cgc ccg etc tac acg gtc gcg ttt tec gee cag gaa ctg tgg ggc 624 
Pro Arg Pro Leu Tyr Thr Val Ala Phe Ser Ala Gin Glu Leu Trp Gly 
195 200 205 

20 

gac gac gga aac ggg aaa gac gta gtg tgc gtc gat etc tgg gaa ccg 672 
Asp Asp Gly Asn Gly Lys Asp Val Val Cys Val Asp Leu Trp Glu Pro 
210 215 220 

2 5 tac ctg ate tct gcg tga 690 
Tyr Leu He Ser Ala 
225 



30 <210> 16 
<211> 229 
<212> PRT 

<213> Rhodococcus erythropolis 
35 <400> 16 

Met Asp Gly He His Asp Thr Gly Gly Met Thr Gly Tyr Gly Pro Val 
15 10 15 



40 



Pro Tyr Gin Lys Asp Glu Pro Phe Phe His Tyr Glu Trp Glu Gly Arg 

20 25 30 



45 Thr Leu Ser He Leu Thr Trp Met His Leu Lys Gly Met Ser Trp Trp 

35 40 45 



Asp Lys Ser Arg Phe Phe Arg Glu Ser Met Gly Asn Glu Asn Tyr Val 
50 50 55 60 



55 



Asn Glu He Arg Asn Ser Tyr Tyr Thr His Trp Leu Ser Ala Ala Glu 
65 70 75 80 



Arg He Leu Val Ala Asp Lys He He Thr Glu Glu Glu Arg Lys His 

85 90 95 



040065 AM 



18 



Arg Val Gin Glu lie Leu Glu Gly Arg Tyr Thr Asp Arg Asn Pro Ser 

100 105 no 

5 

Arg Lys Phe Asp Pro Ala Glu He Glu Lys Ala He Glu Arg Leu His 
115 120 125 

10 Glu Pro His Ser Leu Ala Leu Pro Gly Ala Glu Pro Ser Phe Ser Leu 

130 135 140 

Gly Asp Lys Val Lys Val Lys Asn Met Asn Pro Leu Gly His Thr Arg 
15 145 150 155 ^ 160 



20 



25 



Cys Pro Lys Tyr Val Arg Asn Lys He Gly Glu He Val Thr Ser His 

165 170 175 



Gly Cys Gin He Tyr Pro Glu Ser Ser Ser Ala Gly Leu Gly Asp Asp 

180 185 190 



Pro Arg Pro Leu Tyr Thr Val Ala Phe Ser Ala Gin Glu Leu Trp Gly 
195 200 205 



3 0 Asp Asp Gly Asn Gly Lys Asp Val Val Cys Val Asp Leu Trp Glu Pro 

210 215 220 



Tyr Leu He Ser Ala 
35 225 





<210> 


17 




<211> 


22 


40 


<212> 


DNA 




<213> 


Artificial 




<220> 






<223> 


Primer 


45 








<400> 


17 




gcccgcataa gaaaaggtga 


50 


<210> 


18 




<211> 


21 




<212> 


DNA 




<213> 


.Ar 1 1 f i c l a. 1 


55 


<220> 






<223> 


Primer 



22 



<400> 18 

gcatgccttc aaatcagcct g 



21 



040065 AM 



• 

19 



10 



<210> 19 

<211> 24 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 



<400> 19 

agggtgaacc atatgtcagt aacg 24 



15 <210> 20 

<211> 22 

<212> DNA 

<213> Artificial 

20 <220> 

<223> Primer 



25 



<400> 20 

tgtcggatcc atcagacggt gg 22 



<210> 21 

<211> 23 

<212> DNA 

3 0 <213> Artificial 

<220> 

<223> Primer 

35 <400> 21 

agcaccatat ggatggagta cac 23 



<210> 22 

40 <211> 21 

<212> DNA 

<213> Artificial 

i 

<220> 

45 <223> Primer 

<400> 22 

gttgggaatt caggccgcag g 21 



50 



55 



<210> 23 

<211> 27 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 23 
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20 

cgcggatcca agaaggagat atacatg 27 

<210> 24 

5 <211> 22 

<212> DNA 

<213> Artificial 

<220> 
10 <223> Primer 

<400> 24 

ccgcaacgtt caaacggtct gg 22 



15 



20 



35 



50 



<210> 25 

<211> 27 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 25 

25 aggaatacgc atatgagcga gcacgtc 27 

<210> 26 

<211> 30 

3 0 <212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 26 

gtgtggatcc actcatacga tcacttcctg 3 0 



40 <210> 27 

2 1 1 3 1 

<212> DNA 

<213> Artificial 

45 <220> 

<223> Primer 



<400> 27 

aggaatgagc atatggatgg tatccacgac a 31 



<210> 28 

<211> 33 

<212> DNA 

55 <213> Artificial 



<220> 

<223> Primer 
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21 

<400> 28 

atcgggatcc tttcacgcag agatcaggta egg 33 

5 <210> 29 

<211> 35 

<212> DNA 

<213> Artificial 

10 <220> 

<223> Primer 



15 



55 



<400> 29 

ctcaggatcc aaggagtgat cgtatgagtg aagac 3 5 





<210> 


30 








<211> 


26 








<212> 


DNA 






20 


<213> 


Artificial 








<220> 










<223> 


Primer 






25 


<400> 


30 








acaggagctc tcagtcgatg atggcc 








<210> 


31 






30 


<211> 


315 








<212> 


DNA 








<213> 


Rhodococcus erythropolis 








<220> 








35 


<221> 


CDS 








<222> 


(1) . . (315) 








<223> 










<400> 


31 






40 


atg agt 


gaa gac aca etc act gat 


egg 


etc 




Met Ser 


Glu Asp Thr Leu Thr Asp 


Arg 


Leu 




1 


5 




10 



26 



:cg gcg act ggg ace gee 48 
Pro Ala Thr Gly Thr Ala 

15 

gca ccg ccc cgc gac aat ggc gag ctt gta ttc acc gag cct tgg gaa 9 6 

45 Ala Pro Pro Arg Asp Asn Gly Glu Leu Val Phe Thr Glu Pro Trp Glu 

20 25 30 

gca acg gca ttc ggg gtc gee ate gcg ctt teg gat cag aag teg tac 144 
Ala Thr Ala Phe Gly Val Ala lie Ala Leu Ser Asp Gin Lys Ser Tyr 
50 35 40 45 

gaa tgg gag ttc ttc cga cag cgt etc att cac tec ate get gag gee 192 
Glu Trp Glu Phe Phe Arg Gin Arg Leu lie His Ser He Ala Glu Ala 
50 55 60 



aac ggt tgc gag gca tac tac gag age tgg aca aag gcg etc gag gee 240 
Asn Gly Cys Glu Ala Tyr Tyr Glu Ser Trp Thr Lys Ala Leu Glu Ala 
65 70 75 80 



( 
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22 



age gtg gtc gac teg ggg ctg ate age gaa gat gag ate cgc gag cgc 2 88 

Ser Val Val Asp Ser Gly Leu He Ser Glu Asp Glu He Arg Glu Arg 

85 90 95 

atg gaa teg atg gee ate ate gac tga 315 
Met Glu Ser Met Ala He He Asp 

100 



10 <210> 32 

<211> 104 

<212> PRT 

<213> Rhodo coccus erythropolis 

15 <400> 32 



20 



Met Ser Glu Asp Thr Leu Thr Asp Arg Leu Pro Ala Thr Gly Thr Ala 
15 10 15 



Ala Pro Pro Arg Asp Asn Gly Glu Leu Val Phe Thr Glu Pro Trp Glu 

20 25 , 30 



25 Ala Thr Ala Phe Gly Val Ala He Ala Leu Ser Asp Gin Lys Ser Tyr 

35 40 45 

Glu Trp Glu Phe Phe Arg Gin Arg Leu He His Ser He Ala Glu Ala 
30 50 55 60 



35 



40 



Asn Gly Cys Glu Ala Tyr Tyr Glu Ser Trp Thr Lys Ala Leu Glu Ala 
65 70 75 80 



Ser Val Val Asp Ser Gly Leu He Ser Glu Asp Glu He Arg Glu Arg 

85 90 95 



Met Glu Ser Met Ala He He Asp 

100 



45 • <210> 33 

<211> 1200 

<212> DNA 

<213> Rhodococcus erythropolis 



50 <220> 

<221> CDS 

<222> (1) . . (1200) 

<223> 



55 <400> 33 

atg gtc gac aca cga ctt ccg gtc acg gtg ctg tea ggt ttc ctg ggc 48 

Met Val Asp Thr Arg Leu Pro Val Thr Val Leu Ser Gly Phe Leu Gly 
15 10 15 
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gcc ggg aag acg aca eta etc aac gag ate ctg cga aat cga gag ggt 9 6 

Ala Gly Lys Thr Thr Leu Leu Asn Glu lie Leu Arg Asn Arg Glu Gly 

20 25 30 

5 egg egg gtc gcg gtg ate gtc aac gac atg age gaa ate aac ate gac 144 

Arg Arg Val Ala Val lie Val Asn Asp Met Ser Glu lie Asn lie Asp 
35 40 45 

agt gca gaa gtc gag cgt gag ate teg etc agt cgc tec gag gag aaa 192 

10 Ser Ala Glu Val Glu Arg Glu He Ser Leu Ser Arg Ser Glu Glu Lys 

50 55 60 

ctg gtc gag atg ace aac ggc tgc ate tgc tgc act ctg cga gag gat 240 

Leu Val Glu Met Thr Asn Gly Cys He Cys Cys Thr Leu Arg Glu Asp 
15 65 70 75 80 

ctt ctt tec gag ate age gcc ttg gcc gcc gat ggc cga ttc gac tac 2 88 

Leu Leu Ser Glu He Ser Ala Leu Ala Ala Asp Gly Arg Phe Asp Tyr 

85 90 95 



20 



40 



eta etc ate gaa tct teg ggc ate tec gaa ccg ctt ccc gtc gca gag 33 6 

Leu Leu lie Glu Ser Ser Gly He Ser Glu Pro Leu Pro Val Ala Glu 

100 105 110 



25 acg ttc aca ttc ate gat ace gac ggc cac gcc etc gcc gac gtc gcc 3 84 

Thr Phe Thr Phe He Asp Thr Asp Gly His Ala Leu Ala Asp Val Ala 
115 120 125 

cga etc gac ace atg gtc ace gtc gtc gac ggc cac agt ttt ctg cgc 432 
3 0 Arg Leu Asp Thr Met Val Thr Val Val Asp Gly His Ser Phe Leu Arg 

130 135 140 

gac tac acg get ggg ggc cgc gtc gaa gcc gat gcc ccg gaa gac gaa 480 

Asp Tyr JThr_Ala_ Gly Gly Arg Val Glu Ala Asp_Ala Pro_Glu Asp Glu 

35" 145 " 150* " " ~~ " ' 155 " " " 160 

cga gac ate gcg gat ctg ctt gtc gat cag ate gaa ttt gcc gac gtc 52 8 

Arg Asp He Ala Asp Leu Leu Val Asp Gin He Glu Phe Ala Asp Val 

165 170 175'* 



ate ctg gtg age aag gcc gat etc gtc teg cac cag cac ctg gtc gaa 57 6 

He Leu Val Ser Lys Ala Asp Leu Val Ser His Gin His Leu Val Glu 

180 185 190 



45 ttg ace gca gtc ctg cgc tct ttg aac gca tec get gcg ata gtt ccg 624 

Leu Thr Ala Val Leu Arg Ser Leu Asn Ala Ser Ala Ala He Val Pro 

195 200 205 

atg acg etc ggt cgc ate cca etc gac acg att etc gac acc ggt ttg 672 

50 Met Thr Leu Gly Arg He Pro Leu Asp Thr He Leu Asp Thr Gly Leu 

210 215 220 

ttc teg etc gaa aag get gca cag gcc ccc gga tgg tta caa gaa etc 72 0 

Phe Ser Leu Glu Lys Ala Ala Gin Ala Pro Gly Trp Leu Gin Glu Leu 

55 225 230 235 240 

caa ggt gaa cac ate ccc gaa acc gaa gag tac gga ate agt teg gtg 7 68 

Gin Gly Glu His He Pro Glu Thr Glu Glu Tyr Gly He Ser Ser Val 

245 250 255 
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gtg tac cgc gag cgc gca ccc ttc cac ccc caa egg ctg cat gat ttc 816 

Val Tyr Arg Glu Arg Ala Pro Phe His Pro Gin Arg Leu His Asp Phe 

260 265 270 

5 

etc age age gag tgg acc aac gga aag tta ctt egg gec aag ggc tac 864 

Leu Ser Ser Glu Trp Thr Asn Gly Lys Leu Leu Arg Ala Lys Gly Tyr 
275 280 285 

10 tac tgg aat gec ggc egg ttc acc gag ate ggg agt att tct cag gec 912 
Tyr Trp Asn Ala Gly Arg Phe Thr Glu lie Gly Ser lie Ser Gin Ala 
290 295 300 

ggt cat etc att cgc cac gga tac gtc ggc cgt tgg tgg aag ttt eta 9 6 d 

15 Gly His Leu lie Arg His Gly Tyr Val Gly Arg Trp Trp Lys Phe Leu 
305 310 315 320 

ccc cgt gac gag tgg ccg gec gac gat tac cgt cgt gac gga ate etc 1008 
Pro Arg Asp Glu Trp Pro Ala Asp Asp Tyr Arg Arg Asp Gly lie Leu 
20 325 330 335 

gac aag tgg gaa gaa ccc gtc gga gac tgc cga caa gaa etc gtc ttc 1056 

Asp Lys Trp Glu Glu Pro Val Gly Asp Cys Arg Gin Glu Leu Val Phe 

340 345 350 

25 

ate ggc caa gee ate gac ccg tct cga ctg cac cga gaa etc gac gcg 1104 

lie Gly Gin Ala lie Asp Pro Ser Arg Leu His Arg Glu Leu Asp Ala 
355 360 365 

3 0 tgt eta etc acc aca gec gag ate gaa etc ggg cca gac gtg tgg acc 1152 
Cys Leu Leu Thr Thr Ala Glu lie Glu Leu Gly Pro Asp Val Trp Thr 
370 375 380 

acc tgg age- gac ccc- ctg ggc gtc ggc— tat- acc gac cag-acc-gtt tga - 1200- 
3 5 Thr Trp Ser Asp Pro Leu Gly Val Gly Tyr Thr Asp Gin Thr Val 
385 390 395 

<210> 34 

40 <211> 399 

<212> PRT 

<213> Rhodococcus erythropolis 



45 



<400> 34 

Met Val Asp Thr Arg Leu Pro Val Thr Val Leu Ser Gly Phe Leu Gly 
15 10 15 



5 0 Ala Gly Lys Thr Thr Leu Leu Asn Glu He Leu Arg Asn Arg Glu Gly 

20 25 30 



Arg Arg Val Ala Val He Val Asn Asp Met Ser Glu He Asn He Asp 
55 35 40 45 



Ser Ala Glu Val Glu Arg Glu He Ser Leu Ser Arg Ser Glu Glu Lys 
50 55 60 
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Leu Val Glu Met Thr Asn Gly Cys lie Cys Cys Thr Leu Arg Glu Asp 
65 70 75 80 

5 

Leu Leu Ser Glu lie Ser Ala Leu Ala Ala Asp Gly Arg Phe Asp Tyr 

85 90 95 

10. 

Leu Leu lie Glu Ser Ser Gly lie Ser Glu Pro Leu Pro Val Ala Glu 

100 105 110 



15 Thr Phe Thr Phe lie Asp Thr Asp Gly His Ala Leu Ala Asp Val Ala 

115 120 125 



Arg Leu Asp Thr Met Val Thr Val Val Asp Gly His Ser Phe Leu Arg 
20 130 135 140 



Asp Tyr Thr Ala Gly Gly Arg Val Glu Ala Asp Ala Pro Glu Asp Glu 
145 150 155 160 

25 

Arg Asp lie Ala Asp Leu Leu Val Asp Gin lie Glu Phe Ala Asp Val 

165 170 175 

30 

lie Leu Val Ser Lys Ala Asp Leu Val Ser His Gin His Leu Val Glu 

180 185 190 



3 5 Leu Thr Ala Val Leu Arg Ser Leu Asn Ala Ser Ala Ala lie Val Pro 

195 200 205 



Met Thr Leu Gly Arg lie Pro Leu Asp Thr lie Leu Asp Thr Gly Leu 
40 210 215 220 



Phe Ser Leu Glu Lys Ala Ala Gin Ala Pro Gly Trp Leu Gin Glu Leu 
225 230 235 240 

45 

Gin Gly Glu His He Pro Glu Thr Glu Glu Tyr Gly He Ser Ser Val 

245 250 255 

50 

Val Tyr Arg Glu Arg Ala Pro Phe His Pro Gin Arg Leu His Asp Phe 

260 265 270 



55 Leu Ser Ser Glu Trp Thr Asn Gly Lys Leu Leu Arg Ala Lys Gly Tyr 

275 280 285 . 
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Tyr Trp Asn Ala Gly Arg Phe Thr Glu lie Gly Ser lie Ser Gin Ala 
290 295 300 



5 Gly His Leu lie Arg His Gly Tyr Val Gly Arg Trp Trp Lys Phe Leu 
305 310 315 320 



Pro Arg Asp Glu Trp Pro Ala Asp Asp Tyr Arg Arg Asp Gly lie Leu 
10 325 330 335 



Asp Lys Trp Glu Glu Pro Val Gly Asp Cys Arg Gin Glu Leu Val Phe 

340 345 350 

15 

lie Gly Gin Ala lie Asp Pro Ser Arg Leu His Arg Glu Leu Asp Ala 
355 360 365 

20 

Cys Leu Leu Thr Thr Ala Glu He Glu Leu Gly Pro Asp Val Trp Thr 
370 375 380 



25 Thr Trp Ser Asp Pro Leu Gly Val Gly Tyr Thr Asp Gin Thr Val 
385 390 395 



